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Vorwort. 

Für  den  letzten  deutschen  Psychologenkongreß  (Berlin,  April 
1912)  hatte  ich  ein  Sammelreferat  über  die  psychologischen  Methoden 
der  Intelligenzprüfung  übernommen.  Der  Vortrag  konnte,  da  nur 
eine  Stunde  Redezeit  zur  Verfügung  stand,  lediglich  gewisse  Haupt- 
züge des  sehr  umfangreichen  Themas  in  Umrissen  andeuten.  Eine 
Drucklegung  des  Vortrags  in  dieser  Form  schien  mir  aber  wenig 
zweckmäßig;  vielmehr  forderte  das  jetzt  ständig  wachsende  Interesse 
des  In-  und  Auslandes  an  obigem  Problem  und  zugleich  die  außer- 
ordentlich zersplitterte,  z.  T.  schwer  zugängliche  Literatur  eine  erst- 
malige Gesamtdarstellung,  und  zu  einer  solchen  suchte  ich  daher 
meine  Ausarbeitung  zu  erweitern.  Erörtert  werden:  die  Einzeltests, 
die  Staffelmethoden  (nach  Binet-Simon),  die  Korrelations-  und 
Schätzungsmethoden. 

Auch  in  der  Art  der  Behandlung  habe  ich  den  Rahmen  des 
bloßen  „Samraelberichts"  überschritten.  Ich  beschränke  mich  nicht 
auf  eine  Registrierung  des  Vorhandenen,  sondern  nehme  selbst 
Stellung  zu  den  Problemen,  kritisiere  die  Methoden  und  mache 
Vorschläge  zu  deren  Ausgestaltung  und  Umgestaltung.  Hierbei 
konnte  ich  mich  auf  die  Erfahrungen  stützen,  welche  die  seit 
einigen  Jahren  im  Gange  befindlichen  InteUigenzprüfungen  in  Breslau 
vermittelt  haben.  Von  diesen  Untersuchungen,  an  denen  Psycho- 
logen, Pädagogen  und  Ärzte  in  erfreulicher  Arbeitsgemeinschaft 
beteiligt  sind,  ist  mehreres  bereits  veröffentlicht;  anderes  ist  noch 
im  Werden.  Aber  auch  über  einige  der  noch  nicht  abgeschlossenen 
Forschungen  konnte  ich  dank  der  Freundlichkeit  der  Mitarbeiter 
vorläufige  Mitteilungen  machen.  Ebenso  benutzte  ich  die  Gelegen- 
heit, einige  kleinere  Beiti'äge  zu  dem  Problem,  die  aus  den  Übungen 
des  Breslauer  psychologischen  Seminars  stammen,  einzufügen. 

Eine  gewisse  Begrenzung  erfährt  das  Thema  dadurch,  das  ganz 
überwiegend  von  InteUigenzprüfungen  an  Kindern  und  Jugend- 
lichen die  Rede  ist  Aber  es  ist  ja  die  Eigenart  der  im  engeren 
Sinne  „psychologischen"  Methoden  der  InteUigenzprüfung  (im  Gegen- 
satz z.  B.  zu  den  psychiatrischen),  daß  sie  ihren  Ausgang  nehmen 
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von  dem  kindlichen  Seelenleben,  von  dem  aus  sie  dann  freüich 
auch  den  Zugang  zu  den  Prüfungsmethoden  für  Erwachsene  zu 
gewinnen  suchen.  Deswegen  sind  auch  die  Ergebnisse  für  die 
Pädagogik  —  und  zwar  nicht  nur  für  die  Hüfsschul-  und  Heil- 
pädagogik sondern  auch  für  die  Normalpädagogik  — ,  besonders 
ausführlich  behandelt  worden. 

Die  Intelligenzprüfung  scheint  mir  eines  der  aussichtsreichsten 
Gebiete  der  angewandten  Psychologie  im  eigentlichsten  Sinne  des 
Wortes  zu  sein.  So  glaubte  ich,  auch  weiteren  Kreisen,  die  außer- 
halb der  Fachpsjchologie  stehen,  insbesondere  der  Lehrerschaft 
an  Normal-  und^  HiKsschulen,  den  Schulverwaltungsbehörden, 
den  Nerven-,  Schul-  und  Kinderärzten,  den  Jugendfürsorgern 
die  vorliegende  Übersicht  zugänglich  machen  zu  sollen.  Aus  diesem 
Grunde  wurde  die  Sonderausgabe  veranstaltet.  Sie  möge  die  ge- 
nannten Kreise  einerseits  auf  die  große  Wichtigkeit  und  Fruchtbar- 
keit unserer  Methodik  hinweisen,  andererseits  aber  auch  nnverhüllt 
die  Schwierigkeiten  und  ünfertigkeiten  im  gegenwärtigen  Stand 
unserer  Arbeit  aufzeigen,  um  Übereüungen  in  der  praktischen  Nutz- 
anwendung vorzubeugen. 

Breslau,  im  Oktober  1912. 

W.  Stern. 


Folgende  Abkürzungen  werden  verwandt: 

I.  ^  Intelligenz,  IP.  =  Intelligenzprüfung,  lA.  =  Intelligenzalter,  IE.  =  In- 
telligenzriickstand,  IQ.  =  Intelligenzquotient,  ISch.  =  Intelligenzschätzung,  BS.  = 
Methode  Binet-Simon,  LA.  =  Lebensalter,  KA.  =  Klassenalter  (Normalalter  der 
Klasse,  der  ein  Band  angehört),  Korr.  =  Korrelation. 
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Einleitung. 
Begriff  und  Aufgabe  der  Intelligenzprüfung. 

1.   Intelligenz  und  Intelligenzprüfung. 

Die  neuere  Experimentalpsychologie,  welche  anfing  mit  dem 
Studium  der  Sinneswahrnehmungen,  dann  überging  zu  dem  der 
Vorstellungen  und  Gefühle,  hat  nun  ijn  letzten  Jahrzehnt  auch  die 
eigentlich  intellektuellen  Funktionen  zu  bearbeiten  begonnen.  Und 
hier  ist  es  bemerkenswert,  wie  gleichzeitig  —  wenn  auch  ziemlich 
unabhängig  voneinander  —  die  allgemeine,  theoretische  und  die 
differentielle,  angewandte  Psychologie  diesen  Schritt  taten.  Dort 
entwickelte  sich  die  Psychologie  des  Denkens,  hier  die  Erforschung 
der  Intelligenzunterschiede. 

Mit  dem  zweiten  Problem  allein  hat  es  unser  Bericht  zu 
tun,  und  wir  müssen  uns  streng  an  diese  Abgrenzung  halten.  Die 
Frage  nach  dem  allgemeinen  Wesen  der  I.-Tätigkeit,  die  Unter- 
suchung der  Phänomene,  welche  das  Denken  als  solches  konsti- 
tuieren, dürfen  wir  getrost  jenem  anderen  Zweige  der  Psychologie 
überlassen.  Uns  interessiert  die  I.  nicht  als  Phänomen,  sondern 
als  Anlage,  und  zwar  als  eine  Anlage,  durch  welche  sich  Mensch 
von  Mensch  unterscheidet.  Und  eine  Intelligenzprüfung  ist 
die  Feststellung  des  Grades  dieser  Veranlagung  in  einem  indivi- 
duellen Falle. 

Der  hier  öfter  zu  hörende  Einwand,  daß  das  Problem  der  I.- 
Diagnose überhaupt  nicht  erfolgreich  bearbeitet  werden  könne,  ehe 
wir  nicht  das  allgemeine  Wesen  der  I.  genau  kennen,  ist  meines 
Erachtens  unzutreffend.  In  der  Wissenschaft  gibt  es  nicht  ein 
so  sauberes  Nacheinander  der  verschiedenen  Forschungsaufgaben. 
Wir  messen  elektromotorische  Kraft,  ohne  zu  wissen,  was  Elek- 
trizität ihrem  Wesen  nach  sei;  und  wir  diagnostizieren  so  manche 
Krankheit,  von  deren  eigentlicher  Natur  wir  noch  nicht  viel  wissen, 
mit  sehr  feinen  Prüfungsmethoden.  Ja,  im  Gegenteil:  die  Fort- 
schritte der  I.-Prüfung  können  ihrerseits  von  einer  neuen  Seite  her 
zur  Erhellung  der  theoretischen  I.-Forschung  beitragen  und  so  die 
Denkpsychologie   wertvoll    ergänzen.    Wenn   sich   nämlich   zeigt, 
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daß  gewisse  Symptome  relevant,  andere  irrelevant  für  die  Unter- 
schiede der  I.  zwischen  Mensch  und  Mensch  sind,  wenn  sich 
ferner  ergibt,  daß  eine  Reihe  von  I.-Symptomen  in  enger  Korre- 
lation untereinander  stehen,  andere  in  weniger  enger,  so  muß  da- 
durch Schritt  für  Schritt  auch  unsere  Kenntnis  von  der  Struktur 
der  I.  im  allgemeinen  vermehrt  werden ;  und  so  wird  sich  hier  eine 
fruchtbare  Wechselwirkung  des  Gebens  und  Nehmens  entwickeln. 

Allerdings  können  wir  nicht  ohne  eine  —  wenn  auch  viel- 
leicht nur  provisorische  —  Begriffsbestimmung  der  I.  an  die 
Arbeit  gehen.  Hierbei  müssen  wir  eine  zu  vage  Fassung  des  Be- 
griffs ebenso  wie  eine  zu  enge  vermeiden. 

Eine  zu  weite  Bedeutung  hat  der  Ausdruck  bei  manchen  Psy- 
chiatern gewonnen.  Sie  verstehen  darunter  nämlich  den  Inbegriff 
der  geistigen  Leistungsfähigkeiten  überhaupt,  also  aller  derjenigen 
Eigenschaften,  die  nicht  affekt-  oder  willensmäßiger  Natur  sind. 
Steht  man  auf  diesem  Standpunkt,  dann  sind  selbstverständlich 
die  Aufnahmen  der  Merkfähigkeit  und  der  Lernfähigkeit,  der 
Kenntnisse,  der  Aussage,  der  Unterschiedsempfindlichkeit  eben- 
so integrierende  Bestandteile  einer  IP.,  wie  die  Aufnahmen  der 
Auffassung  und  Kombinationsfähigkeit,  des  Urteilens,  Schließens, 
Definierens,  Kritisierens  usw. ;  und  eine  Frage,  die  für  uns  die 
wichtigste  wird:  nämlich  inwiefern  an  jenen  zuerst  genannten 
Leistungen  die  eigentliche  L  beteiligt  sei,  und  ob  und  wie  sie  in 
ihnen  symptomatisch  hervortrete,  wird  dann  sinnlos.  Aber  gerade 
der  Fortschritt  der  IP.  in  ihren  letzten  Phasen  gegenüber  der 
wahllosen  Aufnahme  des  psychischen  Niveaus  durch  beliebige 
Fragen  und  Tests  beruht  darauf,  daß  wir  die  I.  nicht  nur  gegen 
die  Gemüts-  und  Willensbeschaffenheit  eines  Individuums  ab- 
grenzen, sondern  ihr  auch  innerhalb  der  geistigen  Funktionen 
einen  deutlich  umgrenzten  Platz  anweisen. 

Diese  schon  jetzt  notwendige  Abgrenzung  kann  meines  Er- 
achtens  nicht  nach  einem  phänomenologischen,  sondern  nur  nach 
einem  teleologischen  Gesichtspunkt  vor  sich  gehen.  Ich  definiere 
nämlich : 

Intelligenz  ist  die  allgemeine  Fähigkeit  eines  Indi- 
viduums, sein  Denken  bewußt  auf  neue  Forderungen  ein- 
zustellen; sie  ist  allgemeine  geistige  Anpassungsfähig- 
keit   an    neue   Aufgaben    und    Bedingungen    des    Lebens. 

Die  Definition  scheidet  die  I.  deutlich  von  anderen  geistigen 
Fähigkeiten. 
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Das  Merkmal  des  Neuen,  auf  welches  die  Einstellung  erfolgt, 
trennt  die  I.  vom  Gedächtnis,  dessen  teleologisches  Grund- 
merkmal die  Bewahrung  und  Verwertung  schon  dagewesener  Be- 
wußtseinsinhalte ist. 

Das  Merkmal  der  Anpassung  hebt  immerhin  die  Abhängig- 
keit der  Leistungen  von  äußeren  Momenten  (der  Aufgabe,  den 
Forderungen  des  Lebens)  hervor;  hierdurch  unterscheidet  sich  die 
L  von  der  Genialität,  deren  Wesen  auf  spontane  Neuschöpfung 
geht. 

Das  Merkmal  der  Allgemeinheit  der  Fähigkeit  sondert  end- 
lich die  L  vom  Talent,  dessen  Charakteristikum  gerade  in  der 
Begrenzung  der  Leistungsfähigkeit  auf  ein  inhaltliches  Gebiet 
besteht.  Intelligent  ist  dagegen  nur  derjenige,  der  unter  den  ver- 
schiedensten Bedingungen  und  auf  den  verschiedensten  Gebieten 
sich  neuen  Anforderungen  geistig  leicht  anzupassen  vermag.  Ist 
das  Talent  eine  materiale,  so  die  I.  eine  formale  Leistungsfähigkeit. 

Ich  hoffe,  daß  derartige  Unterscheidungen  dazu  beitragen 
können,  Verwechslungen  zu  verringern,  die  früher  gang  und  gäbe 
waren.  Noch  ist  es  gar  nicht  so  lange  her,  daß  in  der  Psychiatrie 
,,Keuntnisprüfungen"  als  Intelligenzprüfungen  vorgenommen 
wurden  —  Verwechslung  von  Gedächtnis  und  I.  Und  noch  heute 
findet  man  oft  im  Leben,  in  der  Schule  usw.  die  Verwechslung  von 
I.  und  Talent;  so  hält  ein  Fachlehrer,  der  die  spezielle  Befähigung 
eines  Schülers  auf  einem  Gebiet  (z.  B.  Mathematik)  kennt,  ihn 
leicht  ohne  weiteres  für  allgemein  befähigt,  also  intelligent. 

Nun  möge  man  aber  die  Abgrenzung  nicht  auffassen  als  Auf- 
stellung von  lauter  getrennten  Vermögen  (wie  in  der  alten  Ver- 
mögenstheorie). Es  gibt  z.  B.  nie  ein  isoliertes  Funktionieren 
der  I.  für  sich  und  des  Gedächtnisses  für  sich,  vielmehr  ist  jede 
Gedächtnisleistung  mehr  oder  minder  von  I.-Funktionen  durch- 
setzt und  umgekehrt ;  über  das  Mehr  oder  Minder  dieser  Zusammen- 
hänge kann  nur  die  Korrelation  der  geprüften  Symptome  Auskunft 
geben.  Aber  eben  wegen  dieser  Zusammengesetztheit  jedes  wirk- 
lichen seelischen  Prozesses  scheint  mir  obige  Definition  als  regu- 
latives Prinzip  der  weiteren  Forschung  unentbehrlich;  irgend 
eine  Wahrnehmungs-,  Gedächtnis-,  Aufmerksamkeitsleistung  usw. 
ist  zugleich  eine  L-Leistung  insofern,  als  sie  eine  geistige 
Neueinstellung  auf  neue  Anforderungen  enthält. 

Eine  letzte  Einschränkung  müssen  wir  noch  dahin  machen, 
daß  wir  nur  diejenigen  IP.  behandeln,  welche  eine  Gradabstu- 
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fung  zum  Gegenstand  haben.  Dabei  sollen  die  qualitativen  Unter- 
schiede derl.-Typen  (analytisch-synthetisch,  objektiv-subjektiv  usw.) 
durchaus  nicht  gering  eingeschätzt  werden;  es  sei  nur  darauf  hin- 
gewiesen, welche  Bedeutung  der  Aufsatz  als  Prüfungsmittel  für 
derartige  Besonderheiten  hat^).  An  dieser  Stelle  sollen  aber  nur 
solche  Verfahrungsweisen  besprochen  werden,  auf  Grund  deren  man 
von  einem  bestimmten  Menschen  sagen  kann:  seine  Intelligenz  hat 
einen  solchen  und  solchen  Grad. 

Wie  schon  das  Thema  bekundet,  soll  in  unserer  Darstellung  das 
Methodische  durchaus  im  Vordergrunde  stehen,  wodurch  auch  dem 
gegenwärtigen  Stand  der  Frage  am  besten  Gerechtigkeit  wider- 
fäJirt.  Denn  auch  die  Bedeutung  der  bisher  schon  vorliegenden 
Ergebnisse  beruht  doch  vor  allem  darin,  daß  sie  geeignet  sind, 
Winke  für  den  Ausbau  der  Methodik  zu  geben. 

2.   Praktische   Aufgaben    der   IP. 

Da  es  sich  hier  nicht  um  Methoden  zu  rein  theoretischen  Unter- 
suchungen handelt,  sondern  um  solche,  die  auf  das  praktische  Leben 
angewandt  werden  sollen,  hängt  ihre  Gestaltung  mindestens  zum 
Teil  von  den  praktischen  Bedürfnissen  ab,  die  durch  IP.  be- 
friedigt werden  sollen.  Hier  sind  vier  Gruppen  zu  unterscheiden, 
welche  durch  die  Kreuzung  der  Begriffspaare:  abnorme  und  nor- 
male, erwachsene  und  jugendliche  Individuen,  zustande  kommen  2). 

a)  Erwachsene,  nicht  normale  Individuen  bilden  das 
Hauptmaterial  der  Psychiater,  und  bei  diesen  wurde  daher  auch 
zuerst  das  Verlangen  nach  IP.  rege 3).  Nicht  nur,  daß  sie  viele 
Einzelmethoden  schufen,  sie  stellten  auch  ganze  Erhebungsserien 
auf  (Rieger,  Kraepelin,  Sommer,  Ziehen,  Gregor,  Bern- 
stein, Rossolimo  u.  a.).  Der  Inhalt  dieser  Serien  gehört  nur 
zu  einem  Teil  hierher.  Die  weitaus  -  meisten  Elemente  der  Erhe- 
bungen haben  mehr  den  Charakter  von  Fragen  und  qualitativen 
Proben  als  von  quantitativ  abstufbaren  Tests ;  und  wo  selbst  solche 
angewandt  wurden,  fehlte  oft  genug  das  Vergleichsmaterial  an 
Normalen.   Ob  der  Ausfall  irgend  eines  solchen  Tests  schon  wirk- 


^)  Vgl.  zu  dieser  Seite  der  I.  den  Sammelbericht  und  die  Bibliographie  in  1, 
S.  20:3-213,  S.  433/4. 

'')  Eine  ähnliche  Einteilung  findet  sich  bei  Meumann  (15),  der  freilicli  den 
Begriff  der  I.  zum  Teil  viel  weiter  faßt. 

'')  Einen  umfangreichen  Sammelbericht  über  die  wichtigsten  IP.-Methoden 
der  Psychiater  gibt  Jaspers  (12). 
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lieh  das  Zeichen  einer  nicht  mehr  normalen  I.-Schwäche  sei,  wurde 
häufig  beurteilt  auf  Grund  einer  vorgefaßten  Meinung  darüber, 
wie  wohl  vermutlich  normale  Menschen  auf  diesen  Test  reagieren 
dürften.  Dies  ist  in  den  letzten  Jahren  anders  geworden.  Roden- 
wald  (22)  zeigte  für  die  Gruppe  der  Kenntnisprüfungen,  wieviel 
von  dem,  was  a  priori  für  abnorm  gehalten  wurde,  doch  innerhalb 
der  Normalitätsstrecke  liege.  Manche  Psychiater  haben  durch 
breiter  angelegte  Prüfungen  an  Normalen  die  Yergleichsmaßstäbe 
für  ihre  Methoden  zu  gewinnen  gesucht  [Sommer  (26),  Ziehen 
(30),  Ranschburg,  Rossolimo  (2.3 — 25)].  Andere  haben  die  Tat- 
sache verwertet,  daß  von  Psychologen  gewisse  Methoden  schon  in 
größerem  Umfang  an  Normalen  durchgeprüft  waren  (Ebbing- 
haus'  Ergänzungsmethode,  Aussagemethode).  Aber  wie  wenig  dies 
alles  dem  Bedürfnis  der  Psychiater  selbst  genügt,  zeigt  der  Beschluß 
des  internationalen  Medizinerkongresses,  sich  an  die  Psychologen 
zu  wenden,  um  Normalserien  für  die  verschiedenen  psychiatrischen 
IP.-Mittel  zu  schaffen.  Diese  Aufgabe  hat  das  Institut  für  an- 
gewandte Psychologie  übernommen. 

b)  Jugendliche,  nicht  normale  Individuen  sind  erst 
seit  wenigen  Jahrzehnten  ein  Mittelpunkt  pädagogischen,  sozial- 
politischen und  medizinischen  Interesses  geworden.  Die  ganze 
Heilpädagogik,  das  Hilfsschulwesen,  das  Jugendgericht  und  die 
Fürsorgeanstalten  sind  ja  junge  Organisationen.  Sie  aber  verlangen 
genaueres  Studium  der  kindlichen  Individualitäten,  sowohl  zu 
Zwecken  der  Psychodiagnostik  wie  zu  solchen  der  Psychotechnik 
(Einschulung,  Behandlung,  Bestrafung  usw.;.  Für  diese  Bedürf- 
nisse ist  die  Feststellung  der  I.  zwar  nicht  der  einzige,  wohl  aber 
einer  der  wichtigsten  Faktoren. 

Die  Schwächen  der  psychiatrischen  Methoden,  die  wir  oben 
erwähnten,  verdoppelten  sich  nun  diesen  neuen  Aufgaben  gegen- 
über. Denn  wenn  schon  beim  Erwachsenen  der  Normalmaßstab 
wenig  bekannt  war,  an  dem  die  Leistungen  der  Abnormen  zu  messen 
wären,  so  beim  Kinde  überhaupt  nicht.  Hier  genügt  ja  auch  nicht 
ein  Normalmaßstab,  sondern  jede  Altersstufe  hat  ihren  eigenen. 
Die  Größe  eines  I.-Defekts  bei  einem  neunjährigen  Kinde  kann  nur 
beurteilt  werden,  wenn  man  die  Normal-I.  von  Neunjährigen  zum 
Vergleich  heranzieht;  und  so  bei  den  anderen  Altersstufen.  Die 
Forderung,  die  sich  hieraus  ergab,  normale  Prüfungsserien  für 
jeden  Jahrgang  der  Jugendzeit  zu  schaffen,  wurde  nun  nicht  mehr 
von  psychiatrischer,  sondern  von  psychologischer  Seite  in  Angriff 
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genommen.  Alfred  Binet  hat,  unter  Mitwirkung  des  Arztes 
Simon,  ein  solches  Staffelsystem  von  Tests  geschaffen;  und  wenn 
auch  das  System  zurzeit  noch  nichts  weniger  als  endgültig  sein 
mag,  der  Grundgedanke  wird  seinen  unverlierbaren  Wert  behalten 
und  zweifellos  schließlich  zu  einer  vollbefriedigenden  Lösung 
führen.  Schon  jetzt  liegt  eine  internationale  Anwendung  der  Me- 
thode vor,  über  die  im  zweiten  Hauptteil  ausführlich  berichtet  wird. 

c)  Normale  Kinder  und  Jugendliche.  Man  darf  jedoch 
nicht  glauben,  daß  die  IP.  normaler  Kinder  nur  die  sekundäre 
Bedeutung  habe,  den  Schwachsinnsuntersuchungen  die  Vergleichs- 
maßstäbe zu  liefern.  Vielmehr  ist  die  I.-Abstufung  innerhalb 
der  normalen  Breite  ein  ganz  selbständiges  Problem,  das  eben- 
falls stark  mit  praktisch-pädagogischen  Interessen  zusammenhängt. 
Die  üblichen  pädagogischen  Prüfungen  geben  ein  Bild  der  Kennt- 
nisse und  der  äußeren  Leistungseffekte,  aber  nicht  einen  Index 
der  inneren  Veranlagung  des  Kindes,  seiner  geistigen  Eeife  und 
Fähigkeit;  hier  müssen  psychologische  Prüfungen  ergänzend  hin- 
zutreten. Dies  Bedürfnis  drängt  sich  besonders  bei  Aufnahme- 
prüfungen auf,  aber  es  besteht  auch  innerhalb  des  regelmäßigen 
Schulbetriebes;  denn  das  heute  so  dringlich  geäußerte  Verlangen, 
im  Unterricht  möglichst  zu  individualisieren,  setzt  vertieftere 
Kenntnis  der  Individualitäten  voraus.  Ganz  neuerdings  regen  sich 
sogar  ernste  Bestrebungen,  die  Klasseneinheiten  nach  psycho- 
logischen Qualitäten  zu  gruppieren  (Hilfsklassen  für  unternormal 
Begabte,  Förderklassen  für  schwachnormal  Begabte,  Sonderklassen 
für  hervorragend  Begabte,  Parallelklassen  mit  Normal-  und  Mindest- 
lehrstoff für  verschiedene  Begabungsgrade  in  einzelnen  Fächern) 
—  Bestrebungen,  die  mit  automatischer  Notwendigkeit  eine  exak- 
tere Feststellungsmöglichkeit  des  tatsächlichen  Begabungsgrades 
fordern  i). 

Hierbei  muß  man  sich  nun  freilich  vor  der  naheliegenden 
Gefahr  hüten,  daß  man  wähnt,  durch  die  IP.  die  Individualität 
eines  Schülers  in  ihrer  Totalbedeutung  erfaßt  zu  haben;  der  Um- 
stand, daß  wir  die  I.  besser  in  Grade  fassen  können  als  andere 


^)  Die  Gesamtheit  dieser  pädagogischen  Seformbestrebungen ,  die  mit  dem 
I.-Pfoblem  in  Beziehung  stehen,  war  Gegenstand  der  Verhandlungen  des  I.  Deut- 
schen Kongresses  für  Jugendbildung  und  Jugendkunde,  der  vom  Bimde  für  Schul- 
reform 1911  in  Dresden  veranstaltet  wurde.  Die  einschlägigen  Vorträge  imd 
Diskussionen  sind  gesondert  erschienen  (11);  das  spezielle  Problem  der  IP.  kam 
dort  in  Vorträgen  von  Meumann,  Kramer  und  dem  Ref.  zur  Sprache. 
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individuelle  Fähigkeiten,  darf  keinesfalls  zu  ihrer  Überschätzung 
führen.  Aber  eben  die  Möglichkeit,  die  I.  zu  isolieren,  dient  dazu, 
die  Struktur  der  Individualität  zu  enthüllen;  man  kann  feststelle», 
ob  eine  Mehr-  oder  Minderleistung  auf  Talent  oder  Intelligenz 
beruht;  man  kann  untersuchen,  in  welchem  Maße  zwischen  den 
Urteilen  der  Lehrer  über  die  I.  der  Schüler  und  den  experimentellen 
Ergebnissen  eine  Übereinstimmung  besteht;  man  kann  abgrenzen, 
in  welchem  Maße  die  allgemeine  schulische  Leistungsfähigkeit 
einerseits  von  der  I.  als  solcher,  andererseits  von  nichtinteUek- 
tuellen  Faktoren  abhängig  ist;  und  gerade  diese  Grenzfeststellung 
macht  —  wie  später  zu  zeigen  sein  -wird  —  einen  Hauptwert  der 
psj'chologischen  Methoden  aus. 

Untersuchungen  au  normalen  Kindern  mit  spezieller  Eück- 
sicht  auf  unser  Problem  sind  zuerst  mit  Einzeltests  unter- 
nommen worden;  in  Deutschland  begonnen,  fand  diese  Methode  in 
Frankreich  und  besonders  in  Amerika  eine  sehr  ausgebreitete  Ver- 
wendung und  Fortbildung.  In  Frankreich  entstand  dann  das  schon 
erwähnte  Testsystem  mit  Altersstaffeln  von  Binet;  England 
hat  neuerdings  in  die  Bewegung  erfolgreich  eingegriffen,  indem 
es  die  Korrelationsmethodik  in  den  Dienst  der  feineren  IP. 
stellte  (Pearson,  Spearman  u.  a.j.  Die  hier  gegebenen  drei, 
Hauptströmungen  werden  zugleich  das  Einteilungsprinzip  unserer 
späteren  Betrachtungen  bilden. 

d)  Normale  Erwachsene.  Hier  bewegen  ^^ir  uns  noch  durch- 
aus in  Zukunftsaussichten.  Denn  die  bisher  an  normalen  Erwach- 
senen angestellten  IP.  sind  nicht  um  dieser  selbst  willen  vor- 
genommen worden,  sondern  nur  um  Yergleichsmaßstäbe  für  ab- 
norme Individuen  zu  haben.  Wohl  aber  werden  jetzt  schon  An- 
regungen laut.  Münsterberg  weist  darauf  hin,  vrie  wichtig  für 
die  Beratung  der  Beruf  swahl  die  genaue  Kenntnis  der  Individualitat 
wäre,  und  er  macht  bereits  Vorschläge,  wie  die  „Vocation  Bureaux", 
die  es  in  Amerika  gibt,  psychologische  Tests  anstellen  könnten  (19, 
20).  Und  Hauptmann  Meyer  (17,  18)  sieht  m  der  IP.  eine 
Methode,  welche  das  Rekrutenaushebungsgeschäft  begleiten  sollte, 
um   ungeeignete  Elemente  auszuschalten. 

Die  letzten  Betrachtungen  zeigen,  daß  sich  in  Zukunft  das 
Schwergewicht  der  IP.,  welches  bisher  durchaus  innerhalb  der 
Psychopathologie  lag,  merklich  nach  der  Xormalpsychologie  hin 
verschieben   dürfte;  und   die  Arbeit    der  Psycliologie    in    der  Ge- 
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winnung  einer  zuverlässigen  Methotik  wird  daher  nicht  nur  den 
Ärzten  und  Heilpädagogen,  sondern  auch  dem  Normalpädagogen, 
dem  Juristen,  dem  Militär  und  anderen  zugute  kommen. 

Aber  gerade  diese  zu  erwartende  Ausdehnung  der  Intelligenz- 
prüfungspraxis muß  zu  einer  Warnung  führen  nach  mehreren 
Richtungen. 

a)  Wir  sind  noch  mitten  in  den  methodologischen  Vor- 
arbeiten. Die  jetzt  vorhandenen  Methoden  —  das  gilt  auch  vom 
BS.-System  —  sind  noch  nicht  als  diagnostische  Kanons  anzu- 
sehen, die  eine  offizielle  Festlegung  erlauben.  Die  Gesetzgebung 
des  Staates  New  Jersey,  welche  die  Anwendung  von  I.-Tests  bei 
allen  der  Rückständigkeit  verdächtigen  Kindern  anordnet,  scheint 
daher  sehr  verfrüht.  Ebenso  wird  noch  viel,  sehr  viel  Zeit  ver- 
gehen, ehe  die  optimistische  Hoffnung  sich  verwirklichen  wird, 
die  Spearman  an  die  Korr.-Methode  der  IP.  knüpft:  ,,Es  scheint 
sogar  möglich,  den  Tag  vorauszusehen,  da  eine  jährliche  offizielle 
Feststellung  des  ,intellektuellen  Index'  für  jedes  Kind  des  König- 
reichs stattfinden  wird"   [Hart-Spearman   (75),   S.  78]. 

b)  Die  Anstellung  der  Tests  soll  man  nicht  zu  leicht 
nehmen.  Sie  erfordert  große  Übung,  psychologische  Schulung, 
kritischen  Geist.  Der  durchschnittliche  Lehrer  z.  B.,  der  von  den 
ganz  anderen  Methoden  des  pädagogischen  Frage-  und  Prüfungs- 
wesens herkommt,  läuft  Gefahr,  die  Tests  in  jenen  Formen  anzu- 
wenden, wodurch  ihr  Wert  geradezu  illusorisch  würde.  Sollte 
daher  die  Benutzung  von  Tests  zu  praktischen  Zwecken  größeren 
Umfang  gewinnen,  so  ist  die  Ausbildung  eines  besonderen  psycho- 
logisch geschulten  Personals  hierfür  erforderlich.  (Den  Schul- 
ärzten würden  sich  dann  die  Schulpsychologen  zur  Seite 
stellen!). 

Welche  irrigen  Meinungen  bezügUch  der  Leichtigkeit  der  Testanstellung  be- 
stehen, erhellt  z.  B.  aus  der  Äußerimg  von  Hauptmann  Meyer,  die  IP.  bei  der 
militärischen  Aushebung  könnte  dereinst  von  subalternen  Organen  ganz  mecha- 
nisch vorgenommen  werden.  Psychologische  Prüfungen  sind  denn  doch  etwas 
anderes,  als  etwa  die  Feststellung  der  Körperlänge  oder  des  Gewichts,  die  allen- 
falls von  Unteroffizieren  ausgeführt  werden  kann. 

c)  Man  darf  die  Tests  nicht  überschätzen,  als  seien  sie 
automatisch  wirkende  allein  genügende  Geistesproben.  Sie  sind 
höchstens  das  psychographische  Minimum,  das  eine  erste  Orientie- 
rung gestattet  bei  Individuen,   die  man  sonst  gar  nicht  kennt; 

^)  Über  die  Fordeiomg  von  Schulpsychologen  vgl.  11,  S.  19. 
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und  sie  sind  geeignet,  die  anderweitige  Beobachtung  psycho- 
logischer, pädagogischer,  ärztlicher  Art  zu  ergänzen  und  sie  ver- 
gleichbar und  objektiv  graduierbar  zu  machen,  nicht  aber  sie  zu 
ersetzen  i). 

I.  Einzeltests  und  Testserien. 

1.  Die  einzelnen  Tests. 

Alle  psychologischen  Experimente  zerfallen  ihren  Aufgaben 
nach  in  Forschungsexperimente  und  in  Prüfungsexperimente.  Die 
letzteren,  deren  Ziel  darin  besteht,  ,,in  einem  gegebenen  Falle  die 
individuelle  psychische  Beschaffenheit  einer  Persönlichkeit  oder 
eine  einzelne  psychische  Eigenschaft  an  üir  festzustellen"  2), 
werden  jetzt  allgemein  als  „Tests"  bezeichnet.  Zu  den  Tests  ge- 
hören freilich  nicht  nur  Experimente  in  dem  engeren  Sinne  einer 
instrumenteilen  Untersuchung,  sondern  auch  einfache  apparatlose 
Verf ahrungsweisen :  Fragen,  Aufgaben,  Vorlegen  von  Bildern  usw. 
—  sofern  sie  nur  nach  systematischen  wissenschaftlich  geregelten 
Gesichtspunkten  angewandt  und  in  ihren  Ergebnissen  registriert 
werden. 

Auf  keinem  Gebiet  nun  ist  bisher  eine  solche  Fülle  von  Tests 
vorgeschlagen  und  durchgeführt  worden,  wie  auf  dem  der  IP.  Eine 
Totalschilderung  dieser  sämtlichen  Prüfungsmethoden  und  der  mit 
ihnen  erzielten  Ergebnisse  würde  den  Rahmen  dieser  Arbeit 
sprengen;  sie  ist  aber  auch  nicht  notwendig,  da,  wie  sich  bald 
zeigen  wird,  das  grundsätzlich  Wichtige  unseres  ganzen  Problems 
gar  nicht  in  den  einzelnen  Tests,  sondern  in  der  Bildung  wohl- 
durchdachter Testsysteme  liegt,  für  welche  die  Einzeltests  nur  das 
Rohmaterial  abgeben.  Wir  begnügen  uns  also  in  diesem  Teil  des 
Vortrags  mit  einer  kursorischen  Übersicht,  die  in  keiner  Weise 
Anspruch  auf  Vollständigkeit  erhebt^). 

Die  große  Mannigfaltigkeit  der  bisherigen  Vorschläge  und 
Testversuche  rührt  daher,  daß  man  auf  sehr  verschiedenen  Wegen 
demselben  Problem  zusteuerte. 


*)  Ähnliche  T\'arnungen  vor  einer  Übertreibung,  Mechanisierung  und  Dilet- 
tantisierung  der  Testprüfungen  finden  sich  bei  Myers  (21)  und  Bobertag  (40). 
wie  auch  in  Binets  letztem  AVerk  (37,  S.  115  f.)- 

«)  1,  S.  87. 

^)  Die  gesamte  Literatur  über  Einzelt&sts  in  1,  S.  426  ff. ;  der  Anhang  II 
desselben  Buches  gibt  eine  Üljersicht  über  die  Beziehung  der  einzelnen  Tests  zu 
den  Schulleistungen.  —  54  verschiedene  Testarten  (mit  zahlreichen  Unterarten) 
finden  sich  nach  Methodik  und  Hauptergebnissen  beschrieben  in  Whipples  Test- 
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a)  Längere  Zeit  ging  man  von  der  irrigen  Voraussetzung  aus, 
daß  eigentlich  jede  psychologische  Experimentalmethode  als  Test 
benutzbar  sei.  Hierzu  hielt  man  es  lediglich  für  nötig,  die  Ver- 
suchsanordnung sozusagen  in  ihrer  Richtung  zu  verlagern :  wurden 
im  Laboratorium  sehr  viele  Messungen  einer  bestimmten  Art  an 
wenigen  Personen  vorgenommen,  so  wurden  nun  dieselben  Me- 
thoden an  vielen  Individuen,  aber  an  jedem  nur  einmal  oder 
wenige  Male  angewandt.  Zeigte  es  sich,  daß  bei  einem  solchen 
Massenversuch  intelligentere  Personen  im  großen  und  ganzen 
bessere  Durchschnittswerte  lieferten  als  weniger  intelligente,  so 
glaubte  man,  die  Methode  als  I.-Test  ansprechen  zu  können. 

Für  solche  Zwecke  sind,  namentlich  in  früheren  Stadien  der 
Testforschung,  so  ziemlich  alle  Methoden,  welche  dem  psycho- 
logischen Experimentator  vertraut  waren,  durchprobiert  worden; 
Messungen  der  Reaktionszeit,  Bestimmungen  der  Unterschieds- 
schwelle auf  den  verschiedenen  Sinnesgebieten,  optische  Täu- 
scliungen,  Experimente  über  die  motorische  Geschicklichkeit  und 
Kraft,  Assoziations-,  Tachistoskop-,  Silbenlern-  und  andere  Ver- 
suche. Im  einzelnen  erzielte  man  wohl  manche  interessanten  Er- 
gebnisse ;  dennoch  muß  gesagt  werden,  daß  mit  diesen  Experimenten 
viel  Kraft  ziemlich  unnütz  vertan  worden  ist. 

b)  Einen  bedeutenden  Fortschritt  bildete  die  endlich  er-  ~^ 
wachsende  Einsicht,  daß  dieses  blinde  Herumtappen  nicht  weiter- 
führen könne,  daß  vielmehr  die  Auswahl  der  I.-Tests  bestimmt 
sein  müsse  durch  gewisse  Voraussetzungen,  welche  man  über  das 
Wesen  der  I.  mache.  Man  suchte  also  nunmehr  nach  exakten 
Experimentalverfahren,  welche  offensichtlich  und  direkt  L- 
Leistungen  hervorrufen  sollten.  Freilich  wurde  zunächst  das  Pro- 
blem noch  viel  zu  einfach  genommen,  indem  man  ein  bestimmtes, 
deutlich  umgrenztes  psychisches  Phänomen  als  das  Grundsymptom 
der  I.  ansah  und  auf  die  Prüfung  dieses  Sonderphänomens  die 
Testanordnung  einstellte.  <^ 

Das   bekannteste   Beispiel   hierfür   bietet   die   Ebbinghaus- 

handbuch  (28).  —  Eine  sehr  große  Sammlung  von  Testmaterialien  enthielt  die 
Kongreßausstellung  des  Instituts  für  angewandte  Psychologie  in  Berlin,  Ostern  1912, 
über  die  Lipmanns  Katalog  in  dem  vorliegenden  Kongreßbericht  Auskunft  gibt 
(nebst  Literaturnachweisen,  13).  —  Die  Ausstelhmg  ist  nach  dem  Kongreß  in  eine 
ständige  umgewandelt  worden  und  hat  in  der  Deutschen  Unterrichtsausstellung 
des  Preußischen  Kultusministeriums  in  Berlin,  Friedrichstr.  126,  einen  Raum 
überwiesen  erhalten.  Dort  kann  sie  nach  vorheriger  Anmeldung  beim  Sekretär 
des  Instituts  (br.  Li p mann,  Telephon  Amt  Potsdam  Xr.  8)  besichtigt  werden. 
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sehe  sogenannte  Kombinationsmethode  (jetzt  besser  als  Ergänzungs- 
methode bezeichnet)  (5),  Nach  Ebbinghaus  ist  jede  wahre  geistige 
Leistungsfähigkeit  letzten  Endes  auf  Akte  des  „Kombinierens" 
zurückzuführen,  auf  das  Verbinden  ursprünglich  einzeln  gegebener 
Bewußtseinselemente;  deshalb  erdachte  er  jene  Methode,  bei  der 
zwischen  den  zunächst  isolierten  Bruchstücken  eines  lückenhaften 
Textes  durch  die  Versuchspersonen  die  richtigen  Verbindungen 
hergestellt  werden  sollen. 

Das  Prinzip  der  Kombination  und  der  Ergänzung  ist  noch 
von  manchen  anderen  Forschern  in  abweichender  Form  zur  Test- 
aufstellung verwandt  worden. 

So  prüfte  Ries  (78)  die  Fähigkeit,  zwei  Begriffe  in  einen  »logischen  Zu- 
sammenhang zu  bringen,  durch  zwei  Tests:  A.  Es  werden  Wortpaare  geboten, 
deren  GUeder  je  untereinander  logisch  zusammengehören  (z.  B.  Feuer — Rauch; 
Überschwemmung — Xot);  es  wii'd  geprüft,  ob  bei  Xennimg  des  ersten  Elements 
sich  das  zweite  auf  Grund  der  Sinnverknüpftmg  wieder  einstellt.  B.  Es  werden 
Einzelworte  zugerufen,  zu  denen  solche  Worte  ergänzt  werden  sollen,  die  mit 
dem  ersten  ein  tausal  zusammengehöriges  Paar  bilden.  —  Verwandt  hiermit  ist 
das  "Wintelersche  Verfahren,  in  welchem  zu  dem  zugerufenen  Wort  ein  über- 
geordneter oder  ein  untergeordneter  oder  ein  nebengeordneter  Begi-iff  genannt 
werden  soll. 

Sehr  viel  benutzt  wird  die  Masselonsche  Kombinationsprobe,  aus  drei 
gegebenen  Wörtern  einen  sinnvollen  Satz  zu  bilden.  Xeuerdings  hat  Meumann  (16) 
diese  Methode  in  besonderer  Weise  ausgebaut:  er  bietet  solche  Wörter,  die  ent- 
weder in  banaler,  logisch  ziemhch  inhaltloser,  oder  aber  in  logisch  pointierter 
Weise  zu  einem  Satz  verknüpft  werden  können  (z.  B.  „Esel",  ,,Schläge";  pointen- 
lose Lösung:  „Der  Esel  bekommt  Schläge";  pointierte  Lösung:  .,Der  faule  Esel 
bekommt  Schläge");  die  Neigung  zu  dieser  oder  jener  Lösungsform  wird  als 
I.-Index  betrachtet. 

Die  Ergänzungsfähigkeit  auf  optischem  Gebiet  prüft  der  Bildertest  von  Heil- 
bronner  (8,  27):  das  Umrißbild  eines  Gegenstandes  ist  auf  einer  Reihe  von 
Kärtchen  dargestellt,  und  zwar  von  einem  sehr  fragmentarischen  Anfangsbild  an 
in  immer  deutlicherer  Ausführimg  bis  zm*  Vollständigkeit.  Es  wird  festgestellt, 
bei  welcher  Phase  der  TJnvoUständigkeit  bereits  ein  Erkennen  erfolgt.  —  Auch 
das  Zusammensetzen  zerschnittener  Bilder  (Methode  der  rassischen  Psychiater 
Bernstein  und  Rossolimo)  gehört  hierher. 

Andere  Psychologen  hielten  wiederum  ganz  andere  psychische 
Funktionen  für  den  Probierstein  der  Intelligenz. 

So  glaubte  Bin  et  während  einer  früheren  Phase  seines  Ar- 
beitens  (2),  daß  das  Wesen  der  I.  in  der  Anpassungsfähigkeit  der 
Aufmerksamkeit  bestehe;  deshalb  benutzte  er  Aufmerksamkeits- 
tests, wie  das  Durchstreichen  von  Buchstaben  in  einem  bestimmten 
Text  („Bourdonsche  Probe"),  das  Abschreiben  von  Sätzen,  das 
Ästhesiometer  (B,  sah  in  der  Unterscheidung  zweier  benachbarter 
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Zirkelspitzen  nicht  ein  sensorisches,  sondern  ein  Aufmerksajnkeits- 
phänomen),  das  Ordnen  von  Kärtchen,  die  das  Alphabet  oder  Ziffern 
enthalten  usw.  —  Bei  Meumann  (14)  finden  wli-  zeitweilig  einen 
gewissen  einseitigen  Wert  gelegt  auf  das  Verständnis  für  Ab- 
straktes als  Grundzug  der  I.,  weshalb  er  besonders  eine  Prüfung 
des  Behaltens  abstrakter  Wörter  als  Test  empfahl.  —  Eine  ganze 
Reihe  von  Forschern  richtete  ihr  Augenmerk  besonders  auf  die 
Auffassungskapazität  als  I.-Zeichen:  daher  wird  einmal  das 
Auffassen  von  Bildern,  das  andere  Mal  die  Merkfähigkeit  für 
sprachliche  Stoffe  verschiedenen  Inhalts  und  Umfangs  mit  Vor- 
liebe als  Test  verwandt. 

c)  Als  eine  dritte  Hauptgruppe  von  Tests  können  wir  die- 
jenige betrachten,  die  bekannten  pädagogischen  Aufgaben  nach- 
gebildet sind.  Es  gibt  ja  gewisse  Schulleistungen,  welche  eine 
relativ  exakte  Gradmessung  erlauben,  indem  sowohl  ihre  Quan- 
tität (Umfang  des  in  bestimmter  Zeit  Geleisteten),  wie  ihre  Qua- 
lität (Fehlerhaftigkeit)  zahlenmäßig  feststellbar  ist.  Eine  Über- 
tragung auf  psychologische  Zwecke  legten  insbesondere  diejenigen 
Schularbeiten  nahe,  deren  Verlauf  in  sich  ziemlich  homogen  ist: 
so  das  Rechnen  bestimmter  Rechnungsarten,  das  Schreiben  nach 
Diktat,  das  Auswendiglernen  von  Vokabeln  und  Gedichten.  Alle 
diese  Arbeiten  sind  auch  in  der  Tat  zu  I.-Prüfungszwecken  be- 
nutzt worden.  Freilich  liegt  ein  großes  Bedenken  darin,  daß  die 
genannten  Leistungen  in  hohem  Maße  von  äußeren  Bedingungen 
des  Unterrichts  abhängig  sind,  so  daß  die  I.  von  Individuen,  die 
unter  verschiedenen  schulischen  Bedingungen  stehen  oder  standen, 
mit   ihnen   nicht   vergleichsweise   geprüft   werden   kann. 

d)  Eine  vierte  Hauptgruppe  von  Tests  entfernt  sich  noch 
mehr  von  der  Präzision  des  Laboratoriumsexperiments,  nähert 
sich  dafür  aber  um  so  mehr  der  Lebensechtheit.  Sie  bestehen  in 
der  Fixierung  von  solchen  I.-Symptomen,  die  man  auch  im  ge- 
wöhnlichen Leben  als  besondere  Zeichen  der  I.  begrüßt.  Diese 
direkten  Verstandesproben  sind  vor  allem  von  den  Psychiatern 
ausgebildet  worden,  wie  das  Definieren-,  Vergleichen-,  Unter- 
scheidenlassen, das  Verständnis  von  Sprichwörtern,  das  Erfassen 
der  Pointe  eines  Witzes,  das  Erkennen  einer  Widersinnigkeit  in 
einer  Behauptung  oder  in  einer  bildlichen  Darstellung. 

Diese  Tests  haben  den  Vorzug,  daß  hier  fraglos  die  I.  viel 
unmittelbarer  beteiligt  ist  als  bei  den  anderen;  dafür  aber  ist 
meist  eine  Gradation  unmöglich.  Es  sind  „Altemativtests",  welche 
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nur  die  grobe  Entscheidung  richtig  oder  falsch  (-f-  oder  — ) 
erlauben.  Der  einzelne  Test  ermöglicht  daher  auch  nicht  eine 
feinere  Charakteristik  des  Prüflings,  nicht  eine  Einordnung  in 
eine  Skala. 

2.   Die   Unzulänglichkeit   der   Einzeltests. 

Eine  Kritik  aller  dieser  so  verwirrend  mannigfaltigen  Be- 
strebungen könnte  nun  so  vorgehen,  daß  sie  Test  für  Test  darauf- 
hin untersucht,  ob  er  als  Indikator  der  I.  bevorzugt  zu  werden 
verdient.  Weit  wichtiger  aber  als  diese  Spezialuntersuchung  er- 
scheint uns  hier  die  Hervorhebung  eines  prinzipiellen  kritischen 
Gesichtspunktes:  ein  einzelner  Test  für  sich,  er  mag  jioch 
so  gut  sein,  darf  niemals  zum  Werkzeug  einer  indivi- 
duellen IP.   gemacht  werden^). 

Der  einzelne  Test  prüft  nämlich  einerseits  zu  \'iel,  anderer- 
seits zu  wenig  im  Yergleich  zu  dem,  was  er  eigentlich  prüfen  soll. 

Zuviel:  denn  der  psychische  Akt,  der  in  einem  Prüfling 
durch  eine  experimentelle  Aufgabe,  eine  Testfrage  oder  ähnliches 
hervorgerufen  wird,  ist  das  Verschmelzungsprodukt  aus  sehr  ver- 
schiedenen Teilbedingungen;  und  wir  wissen  nicht,  mit  welchem 
Anteil  jene  spezielle  Teilbedingung,  die  wir  I.  nennen,  an  der 
Leistung  partizipiert.  In  dieser  Nichteindeutigkeit  des  Unter- 
suchungsgegenstandes liegt  der  oft  zu  wenig  beachtete  Unter- 
schied zwischen  Test  und  Laboratoriumsexperiment.  Wenn  ich 
über  das  Gedächtnis  im  Laboratorium  Forschungen  anstelle,  so 
weiß  ich,  daß  ich  wirklich  das  Gedächtnis  und  nichts  anderes, 
prüfe,  weil  ich  in  zahlreichen  Einzelversuchen  unter  Konstant- 
haltung aller  anderen  Bedingungen  nur  gewisse  Bedingungen  der 
Gedächtnisfunktion  meßbar  variiere.  Wenn  ich  dagegen  einen 
Lerntest  oder  einen  Merkfähigkeitstest  isoliert  an  einem  Individuum 
anwende,  so  sind  an  dem  Ergebnis  eigentliche  Fähigkeit  des  Be- 
haltens,  Verständnis  für  den  Stoff,  Aufmerksamkeit,  Interesse  usw. 
in  unkontrollierbarer  Weise  beteiligt  —  ganz  abgesehen  von  der 
momentanen  Disposition  des  Prüflings.  Oder  ein  anderes  Beispiel: 
Nehmen  wir  an,  ein  Prüfling  habe  in  der  Ergänzung  von  Text- 
lücken  (nach   Ebbinghaus)   ein   gutes  Ergebnis  gezeigt,   beruht 


1)  Vgl.  Bin  et  (36,  S.  201):  „Un  t&st  ne  signifie  rien,  mais  cinq  ou  six  tests 
signifient  quelque  chose  .  .  C'est  donc  surtout  sur  ce  principe  de  la  multiplicite 
des  tests  qu'il  faut  attirer  l'attention  des  psychologues." 
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dies  vorwiegend  auf  wirklicher  logischer  Kombinationsgabe?  oder 
auf  einem  besonders  großen  Wortschatz?  oder  auf  einem  feinen 
Sprachgefühl?  oder  auf  Übung  im  Kätselraten? 

Der  einzige  Ausweg,  um  die  uns  interessierende  Fähigkeit  — 
also  etwa  die  Kombinationsfähigkeit  —  aus  jenem  Verschmelzungs- 
produkt herauszuanalysieren,  besteht  offenbar  darin,  daß  wir  noch 
mehrere  andersartige  Tests  hinzuziehen,  an  deren  Lösung  eben- 
falls das  Kombinieren  beteiligt  ist,  während  im  übrigen  recht  ver- 
schiedenartige psychische  Gebiete  ins  Spiel  gesetzt  werden.  Etwaige 
Übereinstimmungen  in  dem  Ausfall  der  verschiedenen  Tests  dürften 
dann  mit  Wahrscheinlichkeit  ihrem  gemeinsamen  Faktor  —  in 
unserem  Beispiele  der  Kombinationsfähigkeit  —  zugeschrieben 
werden.  Es  muß  also  ein  Abstecken  der  gesuchten  Fähigkeit  von 
verschiedenen  Seiten  her  erfolgen. 

Aber  angenommen,  es  gelänge  uns,  zwar  nicht  durch  einen 
einzelnen,  aber  durch  eine  kleinere  Anzahl  von  Kombinationstests 
die  Kombinationsfähigkeit  unseres  Prüflings  zu  bestimmen,  haben 
wir  damit  seine  I.  gemessen?  Keineswegs.  Denn  wir  haben  nun 
bei  weitem  zu  wenig  festgestellt.  I.  bedeutet  ja  eine  allseitige 
Fähigkeit;  sie  bezieht  sich  auf  das  geistige  Gesamtverhalten  neuen 
Anforderungen  gegenüber,  und  das  Kombinieren  ist  nur  eine  Seite 
dieses  Verhaltens.  Von  gleicher  Bedeutung  sind  die  anderen  Seiten : 
das  Ergreifen  eines  neu  gegebenen  Gegenstandes  mit  dem  Be- 
wußtsein (Auffassen,  Apperzipieren,  Verstehen),  das  Zerlegen  eines 
Gegebenen  in  seine  Teile  (Analysieren),  das  intellektuelle  Stellung- 
nehmen zu  einem  Inhalt  (Urteilen,  Kritisieren,  Erwägen  und  Ent- 
scheiden) u.  a.  m. 

Es  muß  also  diese  Gesamtheit  der  Intelligenzfunktionen  mit 
berücksichtigt  werden;  und  auf  ihre  faktische  Prüfung  dürfte  nur 
dann  verzichtet  werden,  wenn  man  gewiß  wäre,  daß  sie  mit  irgend 
einer  anderen  Funktion  schon  implizite  mitgeprüft  würde.  Es 
habe  etwa  in  einer  Gruppe  von  Individuen  X.  die  besten  Kom- 
binationsleistungen aufzuweisen:  ist  dann  gewiß,  daß  er  auch  in 
den  andersartigen  I.-Betätigungen  den  ersten  Platz  erringen  würde 
und  daher  mit  Recht  in  bezug  auf  seine  Gesamtintelligenz  als  erster 
zu  rangieren  wäre? 

Die  Frage  aufwerfen,  heißt  sie  verneinen.  Zwar  scheint  mir 
Spearman  (75,  77,  80)  darin  recht  zu  haben,  daß  die  I.  wirklich 
eine  allgemeine  Leistungsfähigkeit  bedeutet,  die  dem  gesamten 
seelischen   Verhalten  eines  Individuums   eine  bestimmte  Nuance 
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verleiht.  Aber  mau  darf  den  Gedanken  nicht  —  was  auch  Spear- 
man  vermeidet  —  bis  zu  einer  mechanischen  Gleichgradigkeit 
aller  einzelnen  zur  I.  gehörigen  Teilfunktionen  auf  den  verschie- 
denen Gebieten  übertreiben.  Dem  widerspricht  schon  der  Umstand, 
daß  ja  an  jeder  Einzelleistung  nicht  nur  der  I.-Grad^  sondern  auch 
der  qualitative  I.-Typ  des  Prüflings  und  daneben  noch  so  und  so- 
viel andere  psychische  Gebiete  beteiligt  sind.  So  gibt  es  Personen, 
die  —  bei  einer  ziemlich  hohen  allgemeinen  I.  —  diese  doch  viel 
mehr  in  analytischen  und  kritischen  Aufgaben  bekunden,  als  in 
synthetischen ;  es  gibt  solche,  bei  denen  die  rezeptiven  L-Leistungen 
(Auffassen  und  Verstehen)  höher  stehen  als  die  mehr  spontanen  usw. 

Schon  das  alltägliche  Leben  zeigt  nun  aber,  daß  wir  unter 
Absehung  von  diesen  qualitativen  Unterschieden  doch  imstande 
sind,  den  Gesamtgrad  der  I.  eines  Menschen  zu  charakterisieren. 
Es  werden  hier  eben  unbewußt  gewisse  Eompensationen  vorge- 
nommen; zwei  Individuen  können  gleichwertige  und  doch  nicht 
allseitig  gleichartige  I.  haben.  Dieses  Kompensieren  muß 
nun  bei  den  Tests  in  ein  gewisses  System  gebracht  wer- 
den. Wir  müssen  die  verschiedenen  Seiten  der  I. -Betätigung  prüfen 
und  aus  den  zum  Teil  in  sich  übereinstimmenden,  zum  Teil  von- 
einander abweichenden  Partialergebnissen  ein  Gesamtbild  des  I.- 
Grades zu  konstruieren  suchen. 

Damit  haben  wir  eine  klare  Stellung  bezüglich  der  anzustre- 
benden Methodik  der  IP.  gewonnen. 

Negativ  mul3  gesagt  werden:  die  isolierende  Prüfungsmethode, 
die  alles  auf  einen  Einzeltest  setzt,  steht  methodologisch  nicht 
höher  als  etwa  die  Beurteilung  des  Gesamtcharakters  eines  Men- 
schen auf  Grund  des  willkürlich  herausgegriffenen  Einzelsymptoms 
der  Handschrift  (Graphologie). 

Positiv  ergibt  sich  dreierlei:  a)  es  müssen  Testserien  her- 
gestellt werden,  die  die  verschiedenen  Teilfunktionen  der  I.  ins 
Spiel  treten  lassen;  b)  es  muß  hierfür  eine  weise  Auswahl  der 
Tests  erfolgen,  indem  aus  der  unübersehbaren  Fülle  von  möglichen 
Tests  nur  solche  mit  hohem  und  sicherem  Symptomwert,  allge- 
meiner Anwendbarkeit,  objektiver  Messungsfähigkeit  heraus- 
gegriffen werden;  c)  es  muß  ein  System  geschaffen  werden,  nach 
welchem  die  einzelnen  Ergebnisse  einer  Prüfung  zu  einem  Re- 
sultantenwert, also  zu  einer  objektiven  Gesamtformel  für  den 
I.-Grad  des  Prüflings,  vereinigt  werden  können,  wobei  verschieden- 
wortige  Leistungen  sich  in  gewisser  Weise  kompensieren  müssen. 
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3.  Testserien. 

Der  ersten  Forderung  ^Yird  schon  seit  langem  entsprochen; 
namentlich  von  psychiatrischer  Seite  sind  seit  Eieger  zahlreiche 
Testserien  für  Zwecke  der  IP.  angewandt  worden.  Bei  diesen  Serien 
wird  gewöhnlich  ein  psychologisches  Schema  zugrunde  gelegt, 
das  freilich  von  Forscher  zu  Forscher  sehr  variiert.  Es  seien 
beispielshalber  zwei  solcher  Listen  zitiert,  die  aus  neuester  Zeit 
stammen. 

Sommer  (26)  bespricht  in  einem  jüngst  gehaltenen  Vortrag  über  die 
Methoden  der  IP.  der  Reihe  nach  die  Prüfimgsmittel  für  folgende  Teilprobleme: 
Beziehung  des  Gedächtnisses,  der  Schulkenntnisse,  des  Rechenvermögens,  der 
Assoziation  zum  Verstand,  ferner  die  Aufmerksamkeit,  die  Auffassungsfähigkeit, 
Vollständigkeit  der  Komplexe,  Analyse  der  Komplexe,  Ergänzung  von  Komplexen, 
mechanischen  Vei-stand  (Findigkeit),  konstruktiven  Verstand,  logische  Unter-  und 
Überordnung,  Kausalitätsbegriff,  intellektuelles  Interesse,  Verständnis  für  die 
Umwelt. 

Ziehen  (30)  teilt  in  der  neuesten  (3.)  Auflage  seiner  „Prinzipien  und 
Methoden  der  IP."  nach  folgenden  Gesichtspunkten  ein:  Retention,  Vorstellungs- 
entwicklung und  Vorstellungsdifferenzienmg  (Generalisation,  Isolation  und  Kom- 
plexion von  Vorstellungen),  Reproduktion  und  Kombination,  und  beschreibt  bei 
jeder  Abteilung  die  zahlreichen  in  seiner  Klinik  gebräuchlichen  Frage-  und  Prüfungs- 
methoden. 

Wenn  man  diesen  und  anderen  Serien  der  Psychiater  die  Viel- 
seitigkeit nicht  absprechen  kann,  so  unterliegen  sie  doch  in  anderer 
Hinsicht  manchen  Bedenken;  die  soeben  unter  b  und  c  ausgespro- 
chenen Forderungen  werden  von  ihnen  nicht  oder  nur  sehr  bruch- 
stückweise erfüllt.  Alle  Serien  machen  nämlich  den  Eindruck, 
als  ob  die  Auswahl  der  Tests  mehr  durch  Zufall  und  Willkür 
als  auf  Grund  einer  wirklichen  Eichung  erfolgt  wäre;  meist  war 
ein  apriorischer  Gedankengang  bestimmend:  daß  eine  gewisse 
Fähigkeit  (z.  B.  die  Eetention  oder  die  Kombination),  welche  als 
zur  I.  gehörig  angenommen  wurde,  durch  ein  gewisses  Prüfungs- 
mittel getroffen  werde.  Ob  gerade  dieser  Test  vor  so  und  so  vielen 
anderen  durch  Schärfe,  Konstanz  und  Bedeutsamkeit  der  durch 
ihn  erzielten  individuellen  Werte  ausgezeichnet  sei,  diese  Frage 
ist  nur  ganz  selten  zum  Gegenstand  einer  eigenen  Yoruntersuchung 
gemacht  worden.  Die  Folge  dieser  Zufallsauswahl  ist  dann  aber  auch 
die  mangelnde  Übereinstimmung  in  den  Testserien  verschiedener 
Forscher;  jede  psychiatrische  Klinik  besitzt  ihre  Sondermethodik 
der  IP.,  jeder  Nervenarzt,  jeder  Hilfsschularzt  wählt  sich  seine 
Tests  nach  privater  Liebhaberei  aus;  und  so  ist  eine  wirkliche 
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Vergleichuiig,  Nachprüfung  und  Vereinigung  der  Ergebnisse  ver- 
schiedener Untersuchungen  bisher  so  gut  wie  unmöglich  gewesen. 

Endlich  leiden  die  üblichen  psychiatrischen  Testserien  daran, 
daß  ihnen  ein  Prinzip  der  Zusammenfassung  der  Ergebnisse 
fehlt.  Daß  es  möglich  ist,  die  I.  eines  Individuums  in  ihrer  Totali- 
tät zu  bewerten,  erkennen  die  Psychiater  an,  indem  sie  die  Prä- 
dikate „bescliränkt  zurechnungsfähig",  „debil",  „imbezill",  „idio- 
tisch" verwenden;  aber  sehen  wir  zu,  wie  sie  im  individuelleca 
Fall  von  den  Befunden  ihrer  Testserien  zu  dem  Gesamturteil  kom- 
men, so  klafft  eine  Lücke.  Das  Mosaik  der  Testergebnisse  ist 
und  bleibt  nur  Rohmaterial ;  kein  methodischer  Grundsatz,  sondern 
subjektive  Würdigung  jener  Resultate,  Intuition  und  Routine  geben 
die  Entscheidung  für  das  Gesamtprädikat,  das  der  I.  beigelegt  wird. 
Darin  liegt  in  gewissem  Sinne  ein  A'orzug;  denn  die  —  fast  künst- 
lerische —  Gabe  der  intuitiven  Einfühlung  und  des  nacherlebenden 
Verstehens  ist  gerade  für  den  Psychiater  unentbehrlich.  Wird  aber 
alles  dieser  Fähigkeit  allein  überlassen,  so  ist  auch  ein  starker 
Nachteil  vorhanden;  denn  jedes  Urteil  bleibt  dann  subjektiv, 
ist  nicht  zu  kontrollieren  und  zu  verallgemeinern.  Daher  ist 
das  Bestreben  berechtigt,  daß  zum  mindesten  neben  jene  in- 
tuitive Diagnose  auch  ein  Verfahren  der  objektiven  Graduierung 
trete.  Zu  diesem  Zweck  muß  die  lose  aneinandergereihte  Testserie 
ersetzt  werden  durch  ein  in  sich  geschlossenes  Testsystem, 
welches  erlaubt,  aus  den  bei  irgend  einem  Prüfling  gefundenen 
Einzelergebnissen  einen  resultierenden  Gesamtindex  herauszu- 
ziehen, und  zwar  nach  methodischen  Vorschriften,  die  aller  Orten 
und  an  Menschen  verschiedener  I.-Beschaffenheit  in  vergleichbarer 
Weise  angewandt  werden  können. 

Soeben  ist  ein  Psychiatei*  mit  einem  solchen  Versuch  hervorgetreten ,  eine 
Reihe  von  Tests  zu  einem  Individualitätsbild  systematisch  zu  verknüpfen.  Es 
ist  die  „Profil-Methode"  des  Russen  Rossolimo  (23 — 24a),  ein  Verfahren,  das 
allerdings  über  die  Absicht  der  bloßen  IP.  hinausgeht  und  daher  nur  teilweise 
in  unseren  Zusammenhang  gehört. 

R.  hat  für  zehn  verschiedene  seelische  Funktionen  je  zehn  Tests  ge- 
schaffen; die  Ergebnisse  eines  Prüflings  werden  graphisch  dargestellt,  indem  für  jede 
geprüfte  Funktion  die  Anzahl  der  geleisteten  Tests  als  Ordinate  eingetragen  wird. 
Die  Endpunkte  dieser  Ordinate  werden  nun  zu  einer  Kurve  verbunden,  die  R. 
das  ,,indi\'iduelle  Profil"  nennt;  die  Profillinie  soll  in  anschaulicher  Weise  die 
Gesamtbeschaffenheit  eines  Kranken  charakterisieren.  So  wird  z.  B.  bei  Krank- 
heitsfoi'men ,  in  denen  bei  sonst  intakter  I.  die  Merkfälligkeit  stark  herabgesetzt 
wird,  das  Profil  an  einer  ganz  bestimmten  Stelle  einen  scharfen  Knick  zeigen  usw. 

In  manchen  Einzelheiten  sind  die  von  R.  vorgeschlagenen  Tests  recht  gut; 
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so  seien  die  kleinen  Yexierinstrumente  hervorgehoLen,  die  dazu  dienen,  die  tech- 
nische Fähigkeit  zu  prüfen:  Auseinanderbringen  von  zwei  ineinander  verschränkten 
Drahtschlingen  usw.  Aber  im  ganzen  ist  das  Prinzip  der  Profilbildmig  doch  zu 
äußerlich,  auch  die  Zuordnung  gewisser  Tests  zu  gewissen  psychischen  Funktionen 
(z.  B.  zui'  "Willenshandlung)  zu  wenig  eindeutig,  um  große  Erfolge  erhoffen  zu  lassen. 

Die  eben  geforderte  Testsystematik  stellt  eine  auiSerordent- 
lich  schwierige  wissenschaftliche  Aufgabe  dar.  Es  ist  daher  wohl 
verständlich,  daß  Psychiater  oder  Pädagogen  nicht  mehr  neben- 
amtlich diese  Aufgabe  lösen  konnten,  sondern  daß  die  Psychologie 
selbst  das  Werk  übernehmen  mußte.  Interessant  hierbei  ist,  daß 
sie  zwei  ganz  verschiedene  Wege  ging,  und  es  erscheint  mir 
wichtig,  diese  im  folgenden  gesondert  zu  behandeln.  Keiner  von 
beiden  darf  als  der  allein  richtige  betrachtet  werden;  eine  jede 
Methode  hat  ihre  Vorzüge  und  Nachteile,  und  vor  allem  hat  jede 
ihre  besonderen  Ziele,  denen  sie  angepaßt  ist.  Die  Methode  der 
Altersstaffelung  von  Binet  und  Simon  dient  einer  gröberen 
Graduierung  der  I.  über  die  gesamte  Skala  der  kindlichen  Ent- 
wicklung hin;  sie  ist  in  vergleichbarer  Weise  anzuwenden  bei 
Kindern  verschiedenen  Alters,  verschiedener  Nationalität  und  Bil- 
dungsschicht, bei  Normalen  und  Schwachsinnigen  aller  Grade. 
Die  Methode  der  Eangkorrelation  beschränkt  sich  dagegen  je- 
weilig auf  eine  Vergleichung  der  Angehörigen  einer  kleinen  homo- 
genen Gruppe,  vermag  aber  innerhalb  dieser  die  L-Abstufung  in 
einer  Feinheit  zu  prüfen,  an  welche  die  Staffelmethode  nicht  ent- 
fernt heranreicht.  Über  das  erste  Verfahren  liegt  schon  verhältnis- 
mäßig viel  Material  vor,  mit  ihm  werden  wir  uns  daher  besonders 
ausführlich  zu  beschäftigen  haben.  Für  die  zweite  Methode  wird  da- 
gegen der  Ausblick  auf  ihre  künftige  Ausgestaltung  überwiegen  müssen. 

Beide  Methoden  sind  bisher  fast  ausschließlich  an  Schul- 
kindern studiert  worden;  doch  ist  zu  erwarten,  daß  auch  die  IP. 
Erwachsener  (und  zwar  gesunder  wie  schwachsinniger)  aus  ihnen 
in  Zukunft  Nutzen  ziehen  wird. 

n.  Die  Methode  der  Altersstaflfelting.    (Methode  Binet-Simon.  ^) 

1.    Das  Prinzip    der  Methode    und  die  verwandten  Tests. 
Binet  und  Simon  faßten  in  den  neunziger  Jahren  den  Ge- 
danken, ein  „Staffelmaß  der  I."  (Echelle  metrique  de  l'intelligence) 

')  Zusammenfassende  Darstelhmgen  seiner  Methode  gibt  Binet  (z.  T.  gemein- 
sam mit  Simon)  in  33 — 37.  Einen  Sammelbericht  über  die  Entwicklung  der 
BS.schen  Methodik  lieferte  Bobertag  (39). 
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zu  schaffen,  das  besonders  zur  IP.  von  Kindern  bestimmt  war.  Die 
an  die  Methode  zu  stellenden  Anforderungen  waren  die  folgenden. 
Es  sollte  für  jede  Altersstufe  der  Kindheit  eine  Testserie  gefunden 
werden,  deren  Lösung  eben  gerade  für  Kinder  dieses  Alters  als 
normal  und  charakteristisch  gelten  kann ;  die  Tests  mußten 
relativ  unabhängig  von  äußerlichen  und  zufälligen  Bedingungen, 
insbesondere  von  den  Schulkenntnissen,  sein,  damit  das  Ergebnis 
möglichst  rein  die  wirkliche  geistige  "Veranlagung  des  Kindes 
zum  Ausdruck  brächte;  sie  sollten  eine  möglichst  gleichmäßige 
Anwendung  unter  den  verschiedensten  Bedingungen  der  Nation, 
der  Sprache,  der  Bildung  erlauben;  sie  sollten  leicht  ausführbar, 
nicht  an  Laboratorium  und  Präzisionsapparate  gebunden  sein,  den 
Prüfling  nicht  zu  lange  Zeit  in  Anspruch  nehmen,  nicht  belästigen 
und  ermüden,  zugleich  aber  eine  solche  Exaktheit  besitzen,  daß 
die  von  verschiedenen  Forschern  vorgenommenen  Untersuchungen 
miteinander  verglichen  und  aneinander  gemessen  werden  könnten; 
sie  sollten  endlich  die  Herstellung  eines  Resultantenwertes  für  jeden 
Prüfling  erlauben,  der  als  Maßzahl  seiner  Gesamtintelligenz  gelten 
kann. 

Es  sieht  zunächst  so  aus,  als  ob  die  Erfüllung  so  verschieden- 
artiger Ansprüche  auf  unüberwindliche  Schwierigkeiten  stoßen 
müßte.  Fehlte  doch  vor  allem  jede  Torkenntnis  darüber,  welche 
intellektuellen  Leistungen  man  auch  nur  ungefähr  bei  einem  Kinde 
bestimmten  Alters  erwarten  dürfe.  Man  frage  einmal  einen  Lehrer 
oder  eine  Persönlichkeit,  die  sich  jahrelang  mit  Kindern  verschie- 
denen Alters  beschäftigt  hat:  von  welcher  Altersstufe  man  wohl 
verlangen  könne,  daß  der  Unterschied  zwischen  zwei  genannten 
Objekten  (z.  B.  Holz  und  Glas)  richtig  angegeben  werde,  und 
welche  Altersstufe  zur  Angabe  des  Unterschieds  zwischen  ab- 
strakten Begriffen  (z.  B.  Lüge  und  Irrtum)  befähigt  sei  —  der 
Gefragte  xsiirde  schweigen  oder  ziemlich  blind  darauflos  raten 
müssen.  So  war  also  hier  völliges  Neuland  zu  bearbeiten.  Dazu 
noch  die  anderen  obengenannten  Bedingungen,  die  zum  Teil  nur 
schwer  miteinander  vereinbar  schienen :  Unabhängigkeit  von  Schul- 
kenntnissen, allgemeine  leichte  Anwendbarkeit,  Kürze  der  Prüfung, 
Exaktheit,  Berechnungsmöglichkeit  —  kein  Zweifel,  daß  hier  eines 
der  schwersten  Probleme  vorlag,  welches  die  angewandte  Psycho- 
logie sich  bisher  überhaupt  gesetzt  hat. 

Und  doch  ist  die  Schwierigkeit  prinzipiell  bewältigt  worden. 
Freilich  ist  keine  Eede  davon,  daß   die  gegenwärtig  vorliegende 
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Form  der  Methode  als  die  endgültige  angesehen  werden  könnte; 
sie  wird  vermutlich  in  den  nächsten  Jahren  noch  so  viele 
Umgestaltungen  zu  erfahren  haben,  daß  sie  schließlich  nicht  mehr 
wiederzuerkennen  sein  wird.  Aber  wir  wissen,  daß  wir  uns  auf 
dem  richtigen  Weg  befinden,  und  welches  Verdienst  sich  Bin  et 
und  sein  Mitarbeiter  Simon  mit  der  "Weisung  dieses  Weges  er- 
worben haben,  werden  wohl  erst  künftige  Jahrzehnte  voll  würdigen 
können. 

Vor  kurzer  Zeit  —  am  18.  Oktober  1911  —  ist  der  geist- 
volle und  liebenswürdige  Schöpfer  der  Methode  gestorben.  Sein 
allzu  früher  Heimgang,  den  wir  auf  das  schmerzlichste  beklagen, 
zwingt  nun  andere,  den  von  ihm  gesponnenen  Faden  aufzunehmen ; 
und  ein  solcher  Moment  ist  wohl  dazu  angetan,  das  bisher  Ge- 
wonnene in  kurzer  Zusammenfassung  darzustellen  und  auf  die 
weiter  zu  ergreifenden  Maßnahmen  hinzuweisen. 

Nach  vieljährigen  empirischen  Voruntersuchungen  darüber, 
welche  Tests  für  bestimmte  Lebensalter  als  normal  zu  betrachten 
seien,  haben  B.  und  S.  im  Jahre  1908  die  erste  Gesamtaufstellung 
ihres  Testsystems  veröffentlicht  (33),  welches  Serien  für  die  Alters- 
stufen von  3  bis  zu  13  Jahren  enthielt.  Für  jede  Altersstufe  sind 
5 — 7  Tests  vorgesehen.  Eine  revidierte  Fassung  erschien  1911 
(35,  36) ;  in  ihr  sind  manche  Tests  verändert,  manche  einer  anderen 
Altersstufe  zugewiesen  und  die  Testanzahl  für  jede  Altersstufe 
gleichmäßig  auf  5  gebracht.  Das  System  von  1911  enthält  statt 
der  Tests  für  11-,  12-  und  13  jährige  solche  für  13  jährige,  15- 
jährige  und  Erwachsene. 

Das  Verzeichnis  aller  bisher  nach  BS.  angestellten  Forschungen 
gibt  die  Literatur  am  Schluß ;  eine  vergleichende  Zusammenstellung 
der  Testserien  nach  BS.  1908,  BS.  1911,  Bobertag  und  Terman- 
Childs  für  die  verschiedenen  Altersstufen   enthält  der  Anhang. 

Wie  ein  Blick  über  das  Testverzeichnis  lehrt,  handelt  es 
sich  fast  durchweg  um  Alternativtests,  d.  h.  um  solche,  deren 
Lösung  nicht  abstufbar  ist,  sondern  nur  als  richtig  oder  falsch 
(-(-  oder  — )  gewertet  werden  kann.  Nichtbeantwortung  wird  eben- 
so wie  eine  offenkundig  falsche  Antwort  als  j\Iinus  gerechnet. 
Freilich  ist  es  im  Einzelfalle  oft  schwer  genug,  sich  für  das  Prä- 
dikat -j-  oder  —  zu  entscheiden;  hier  kann  nur  eine  lange  Übung 
und  eine  gleichmäßige  Innehaltung  der  einmal  für  die  Entschei- 
dung gewählten  Kriterien  Sicherheit  gewähren. 

Die   Mannigfaltigkeit  der  Tests   ist  sehr  groß. 
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Das  Gedächtnis  wird  geprüft  einerseits  in  der  Form  der  Merkfähigkeit 
fiir  Ziffern  und  Sätze  verschiedener  Länge,  für  eine  vorgelesene  Geschichte  und 
für  drei  zugleich  aufgegebene  kleine  Aufträge,  andererseits  in  der  Form  des  Besitz- 
standes an  elementaren  Alltagskenntnissen  (Wochentage,  Monate,  Münzen, 
rechts  und  links).  Reichtum  und  Verfügbarkeit  des  "^'ortschatzes  wird  fest- 
gestellt durch  die  Anzahl  der  in  drei  Minuten  zu  nennenden  "Worte. 

Seit  1911  ist  auch  ein  Test  für  die  Suggestibilität  (bei  Beurteilung  von 
Linienlängen)  eingefügt. 

Motorische  Fähigkeiten  prüfen  einige  Tests  des  Al)zeichiiens,  Ausschneidens, 
Schreibens.  Mit  praktischen  Fertigkeiten  hat  man  es  bei  dem  Abzählen 
von  Münzen,  dem  Herausgeben  auf  ein  größeres  Geldstück,  dem  Au.sführen  der 
oben  genannten  drei  Aufträge  zu  tim. 

Die  meisten  Tests  gehen  aber  noch  unndttelbarer  auf  eigentliche  Lntelligenz- 
leistimgen.  Das  Vergleichen  bzw.  Unterscheiden  konamt  in  sehr  ver- 
schiedenen FoiTuen  vor  als:  sensorisches  Vergleichen  (von  gleich  aussehenden 
Kä-stchen  verschiedener  Schwere),  logisches  Untei*scheiden  aus  dem  Gedächtnis, 
und  zwar  von  Konkretem  (Holz  und  Glas,  Fliege  und  Schmetterling)  und  von 
Abstraktem  (Lüge  und  IiTtum),  ästhetisches  Vergleichen  (von  abgebildeten  schönen 
und  häßlichen  Gesichtern).  Ferner  gibt  es  Tests  für  das  Definieren  von  Kon- 
kretem wie  von  Abstraktem;  das  Ergänzen  von  Lücken  in  einem  Test;  das 
Kombinieren  eines  Satzes  aus  drei  Worten;  das  Ordnen,  und  zwar  sowohl 
das  sensorische  Ordnen  (von  fünf  Kästchen  in  einer  Eeihe  nach  ihrer  Schwere), 
wie  das  sprachlich-logische  Ordnen  (der  durcheinander  gewürfelten  Worte  eines 
Satzes);  das  verstehende  Auffassen  eines  Budes;  das  kritische  Auffassen, 
imd  zwar  optisch  (Bemerken  von  Lücken  an  gezeichneten  Figuren)  und  logisch 
(das  Erkennen  von  WidersLnnigkeiten  in  bestimmten  Sätzen);  die  praktisch- 
moralische Intelligenz  (durch  Fragen  in  der  Form:  Was  würdest  du  tun, 
wenn  das  imd  das  geschähe?). 

Manche  Tests  wiederholen  sich  bei  verschiedenen  Altersstufen 
derart,  daß  dann  jedesmal  der  Maßstab  der  Anforderung  ein  anderer 
ist.  So  werden  die  Bilder  allen  Jahrgängen  vorgelegt;  ein  bloßes 
Aufzählen  der  abgebildeten  Objekte  entspricht  dem  Niveau  der 
Dreijährigen,  ein  Beschreiben  der  Handlungen,  welche  die  Personen 
ausführen,  dem  Niveau  der  Siebenjährigen,  eine  Erfassung  des 
Zusammenhangs  dem  Niveau  der  Zwölfjährigen.  Das  Definieren 
konkreter  Wörter  kommt  vor  in  den  Staffeln  der  Sechsjährigen  und 
der  Neunjährigen ;  bei  jenen  genügt  Definition  durch  bloße  Zweck- 
angabe (Was  ist  ein  Pferd?  „Zum  Reiten"),  bei  diesen  wird  eine 
darüber  hinausgehende  verlangt  (z.  B.  Was  ist  ein  Pferd?  „Ein 
Tier").  Endlich  sind  die  Merkfähigkeitstests  für  Ziffern  und  Sätze 
nach  der  Länge  vielfach  abgestuft;  so  sollen  die  Dreijährigen 
zwei,  die  Vierjährigen  drei,  die  Siebenjährigen  fünf,  die  Zwölf- 
jährigen sieben  Ziffern  nach  einmaligem  Hören  nachsprechen 
können. 
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Der  Wert  der  einzelnen  Tests  ist  ungleich.  Manche  sind  ganz 
ausgezeichnet,  wie  das  Definieren,  die  Bildbeschreibung,  die  In- 
telligenzfragen. Sehr  wertvoll  ist  es  ferner,  daß  es  Tests  gibt, 
deren  Lösung  von  sprachlicher  Gewandtheit  unabhängig  ist;  so 
das  Ordnen  der  fünf  Gewichte,  die  ästhetische  Vergleichung,  das 
Erkennen  von  Lücken  in  Bildern;  ist  man  doch  sonst  nur  allzu- 
sehr geneigt,  die  Beherrschung  des  sprachlichen  Ausdrucks  mit  I. 
gleichzusetzen,  was  oft  ein  Fehlschluß  ist.  Andere  Tests  dagegen 
sind  doch  noch  in  höherem  Maße  als  wünschenswert  von  äußeren, 
namentlich  häuslichen  Einflüssen  abhängig  (z.  B.  Kenntnis  der 
Münzen)  oder  im  wesentlichen  Funktionen  des  rein  mechanischen 
Gedächtnisses  (Hersagen  der  Wochentage),  so  daß  sie  künftig 
besser  durch  andere  zu  ersetzen  wären.  Allerdings  bietet  hier 
eine  Änderung  in  der  Testauswahl  und  Anordnung  eine  ganz 
andere  Schwierigkeit,  als  wenn  es  sich  um  lose  Testserien  handelte. 
Denn  da  jeder  Test  an  der  Herstellung  des  Eesultantenwertes  be- 
teiligt ist,  kann  eine  Änderung  möglicherweise  das  Gleichgewicht 
des  ganzen  Systems  erschüttern.  Man  sieht  dies  deutlich  an  dem 
nachträglichen  Versuch  von  B.  und  S.  selbst,  Korrekturen  an 
ihrem  System  vorzunehmen  durch  Fortlassung,  Neueinführung  und 
Verlegung  einzelner  Tests;  wie  Nachprüfungen,  z,  B.  von  Terman 
und  Childs  und  von  Chotzen,  gezeigt  haben,  ist  die  zweite 
Fassung  von  1911  in  manchen  Hinsichten  weniger  brauchbar,  als 
die  ältere  Form  von  1908. 

Wie  hier  Abhilfe  zu  schaffen  sein  wird,  kommt  im  Abschnitt 
5  a  zur  Besprechung. 

Die  Technik  der  BS. -Methode  ist  durchaus  nicht  so  leicht, 
wie  es  bei  der  Einfachheit  des  Instrumentariums  zunächst  scheinen 
möchte.  Es  ist  zu  empfehlen,  daß,  soweit  irgend  angängig,  der 
Prüfer  stets  mit  einem  Protokollführer  zusammen  arbeite,  damit 
die  schädliche  Aufmerksamkeitsteilung  auf  Prüfen  und  Protokol- 
lieren vermieden  werde.  Beide  Experimentatoren  müssen  sich  eine 
große  Übung  erworben  haben  und  gut  aufeinander  eingearbeitet 
sein,  ehe  sie  zu  ihren  eigentlichen  Versuchen  schreiten.  Der 
■Prüfer  muß  eine  fast  mechanische  Treffsicherheit  und  Gleich- 
mäßigkeit im  Formulieren  der  immer  wiederkehrenden  Fragen,  im 
Tonfall  usw.  besitzen;  er  muß  aber  auf  die  vielen  individuellen 
Variationen,  die  durch  das  verschiedene  Verhalten  der  Prüflinge 
eintreten,  gefaßt  sein  und  bestimmte  Maßnahmen  dafür  in  Bereit- 
schaft halten.  Nie  darf  er  durchblicken  lassen,  daß  er  mit  manchen 
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Antworten  mehr,  mit  anderen  weniger  zufrieden  ist,  sondern  muß  stets 
die  gleichmäßige  ruhige  Freundlichkeit  bewahren.  Der  Protokoll- 
führer möge  sich  nicht  nur  auf  das  Notieren  der  Plus-  und  Minus- 
zeichen beschränken,  wie  sie  das  Endergebnis  jedes  Tests  aus- 
drücken, sondern  auch  in  möglichstem  Umfange  die  Aussagen  des 
Prüflings  sowie  bemerkenswerte  Yerhaltungsweisen  notieren.  Dies 
ist  einerseits  nötig,  weil  die  Entscheidung,  ob  Plus  ^oder  Minus, 
oft  genug  erst  nachträglich  bei  ruhiger  Überlegung  möglich  ist  — 
wofür  dann  das  Material  vorliegen  muß  — ,  andererseits,  weil  ja 
auch  eine  qualitative  Analyse  des  Prüflings  ermöglicht  werden  soll. 

Der  einzelne  Prüfling  darf  natürlich  nicht  nur  mit  den  Tests 
seines  Alters,  sondern  muß  —  wegen  der  bald  zu  besprechenden 
Staffelstreuung  —  mit  einem  beträchtlichen  Bruchteil  der  ganzen 
Serie  geprüft  werden.  Man  beginne  hierbei  weder  mit  den  allzu 
leichten  noch  mit  den  allzu  schweren  Tests,  sorge  für  Abwechs- 
lung und  füge,  wenn  Ermüdung  merkbar  sein  sollte,  kleine  Pausen 
ein.  Die  individuelle  Prüfung  dauert  je  nach  Alter  und  Umständen 
bei  normalen  Individuen  20 — 30  Minuten,  bei  nichtnormalen  wegen 
der  langsameren  Reaktion  1/2 — ^k  Stunden. 

Bei  Massenuntersuchungen  bestellt  die  Schwierigkeit,  daß  schon  Geprüfte 
und  noch  zu  Piüfende  miteinander  in  Verkehr  treten  können.  Freilich  ist  die 
Gefahr  einer  psychischen  Infektion  bei  der  Eigenart  des  Testmaterials  nicht  allzu 
groß;  dennoch  soll  man,  soweit  es  geht,  die  Möglichkeit  einer  Yerständigimg 
vermeiden.  So  empfiehlt  es  sich  z.  B.  nicht,  die  Schüler  einer  Klasse  an  mehreren 
aufeinanderfolgenden  Tagen  zu  prüfen.  SoU  eine  größere  Gruppe  zusammen- 
gehöriger Kinder  geprüft  werden,  so  scheint  das  in  Breslau  angewandte  Verfahren 
brauchbar:  Vier  Experimentatoren  (mit  ihren  Protokollfühi-ern) ,  die  alle  auf  die 
Technik  in  gleichmäßiger  Weise  eingeübt  waren,  prüften  an  demselben  Nach- 
mittag in  verschiedenen  Eäumen.  Jeder  Experimentator  konnte  in  dieser  Zeit 
4 — 5  Prüflinge  erledigen,  und  jeder  Prüfling  mußte  nach  seiner  Untersuchung 
sofort  nach  Hause  gehen;  so  wurden  16 — 20  Klassengenossen  geprüft,  ohne  daß 
ein  Gedankenaustausch  zwischen  ihnen  möglich  gewesen  wäre. 

Bezüglich  aller  weiteren  Details  der  Technik  muß  auf  die 
Gebrauchsanweisungen  verwiesen  werden,  die  bereits  für  die  ver- 
schiedenen Nationen  vorliegen. 

Solche  Gebrauchsanweisungen  gaben  BS.  für  die  Unter- 
suchung an  französischen  Kindern  im  Jahre  1911  (35.,  36),  für 
englisch-amerikanische  Verhältnisse  Whipple  in  seinem  Manual 
(28),  Wallin  (67)  und  (kürzer)  Huey  (9),  für  Italien  Treves- 
Saffiotti  (66).  Für  deutsche  Verhältnisse  hat  zuerst  Lipmann 
die  Tests  möglichst  wortgetreu  übertragen,  sodann  aber  Bober- 
tag    (40)    seine    praktisch    erprobte    Bearbeitung    ausführlich   ge- 
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schildert,  die  sich  in  einigen  Punkten  (z.  B.  in  der  Wahl  der 
Bilder)  zum  Vorteil  von  BS.  unterscheidet.  Die  ausführliche  An- 
weisung von  Bobertag  zur  Prüfungs-  und  Fragetechnik  wurde 
dann  allen  weiteren  deutschen  Untersuchungen  zugrunde  ge- 
legti). 

2.    Die    Resultantenwerte:    Intelligenzalter,    Intelligenz- 
rückstand, -vorspruug,  -stillstand;  Intelligenzquotient. 

"Wir  haben  nun  zu  betrachten,  wie  aus  den  Testleistungen 
eines  Prüflings  die  Bestimmung  seines  I.-Grades  abgeleitet  werden 
kann. 

Stellt  man  sich  die  Sache  schematisch  vor,  so  sollte  man 
denken,  daß  die  I.-Stufe  ausgedrückt  wird  durch  die  Staffel,  deren 
Tests  das  Kind  noch  gerade  löst;  ein  Prüfling,  der  bei  allen  Tests 
bis  zu  denen  der  Neunjährigen  lauter  Treffer  liefert,  bei  denen 
der  Zehnjährigen  und  älteren  aber  versagt,  besäße  damit  den  I.- 
Grad der  Neunjährigen. 

Aber  so  einfach  liegen  die  Verhältnisse  in  Wirklichkeit  nie- 
mals. Die  sämtlichen  Tests  irgend  einer  Altersstufe  —  sie  mögen 
a,  b,  c,  d,  e  heißen  —  sind  nicht  für  alle  Kinder  von  gleicher 
Schwierigkeit,  sondern  hier  gibt  es  die  merkwürdigsten  indivi- 
duellen Variationen.  Das  eine  Kind  leistet  a  bis  d,  versagt  aber  bei  e ; 
ein  andere-s  bewältigt  a,  c  und  e,  aber  nicht  b  und  d.  Dies  liegt 
einerseits  an  den  momentanen  Schwankungen  der  Aufmerksamkeit, 
der  Ermüdung  usw.,  mit  denen  man  natürlich  immer  rechnen  muß, 
andererseits  aber  auch  an  qualitativen  Unterschieden  der  I,  Die 
Korrelation  der  einzelnen  Seiten  der  I.-Funktionen  ist  eben  nie 
eine  so  große,  daß  eine  positive  Leistung  in  a  auch  eine  solche  in 
den  ungefähr  „gleich  schweren"  Tests  b  bis  d  mit  Notwendigkeit 
einschlösse. 

Daraus  ergibt  sich,  daß  die  Jahresstaffeln,  die  ein  Kind  voll 
beherrscht,  und  diejenigen,  die  zweifellos  jenseits  seiner  Leistungs- 
fähigkeit stehen,  nicht  scharf  gegeneinander  abgegrenzt  sind, 
sondern  daß  es  ein  mehr  oder  minder  breites  Zwischengebiet  gibt, 
in  welchem  positive  und  negative  Leistungen  unregelmäßig  ver- 
streut sind;  wir  wollen  es  das  Gebiet  der  Staffelstreuung  nennen. 


^)  Das  einfache  Instrumentarinm  für  die  deutsche  Prüfung  nach  Bobertag 
(Fragelisten,  Merkfähigkeitsproben,  Bilder,  Gewichtskästchen  usw.)  ist  von  dem 
Institut  für  angewandte  Psychologie  in  Klein-Glienicke  zu  beziehen. 
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Das  Herausziehen  eines  Mittelwertes  aus  diesem  Gebiet  kann  nicht 
gänzlich  ohne  Willkür  vor  sich  gehen,  aber  das  von  BS.  vor- 
geschlagene Rechnungsverfahren  schien  bisher  zu  genügen. 

Hiernach  wird  zunächst  festgestellt,  bis  zu  welcher  Alters- 
staffel die  Tests  vollständig  gelöst  sind  (wobei  ein  einziger 
etwa  mißglückter  Test  nicht  gerechnet  wird,  da  das  Versagen 
auf  ein  momentanes  Naclilassen  der  Aufmerksamkeit  geschoben 
werden  kann).  Diese  Altersstufe  wird  als  Grundlage  gewählt, 
aber  je  fünf  gelöste  Tests  aus  höheren  Staffeln  werden  als 
eine  weitere  Altersstufe  zugerechnet.  Wenn  also  ein  Kind  alle 
Tests  bis  zu  der  Staffel  der  Sechsjährigen  einschließlich  (mit 
Ausnahme  eines  einzigen)  löst,  ferner  je  drei  Tests  der  Sieben-, 
Acht-,  Neunjährigen,  und  noch  einen  Test  der  Zehnjährigen,  so 
sind  diese  zehn  überzähligen  Tests  als  zwei  Jahresgrade  zu  rechnen, 
und  das  Kind  erhält  als  Resultantenwert  der  I.  6  -j-  2  Jahre,  d.  h. 
seine   I.  wird   der   der   Achtjährigen   gleichgesetzt. 

Der  Resultantenwert,  mit  dem  die  Gesamt-I.  des  Prüflings 
graduiert  wird,  hat  also  die  Bedeutung  einer  Altersangabe;  er 
drückt  aus,  daß  die  I.  des  geprüften  Kindes  gleichwertig  der  durch- 
schnittlichen I.  von  Kindern  des  genannten  Alters  ist.  Wir  ge- 
winnen damit  den  Begriff  des  Intelligenz  alters  (abgekürzt  lA.; 
„niveau  intellectuel'',  „mental  age"),  welcher  den  Angelpunkt  der 
ganzen  Staffelmethode  bildet. 

Das  lA,  darf  nun  freilich  nicht  als  eine  völlig  eindeutige 
Festlegung  der  I.  eines  Prüflings  betrachtet  werden,  sondern  nur 
als  eine  ganz  grobe  Charakteristik  des  quantitativen  I.-Wertes, 
unbeschadet  der  qualitativen  Unterschiede;  denn  ein  und  dasselbe 
lA.  kann  aus  Staffelstreuungen  der  verschiedensten  Art  abgezogen 
werden.  Aber  hierin  scheint  nicht  ein  Nachteil,  sondern  ein  Vor- 
teil des  Begriffs  des  lA.  zu  liegen.  Denn  er  wird  dadurch  zum 
Ausdruck  einer  schon  früher  erwähnten  psychologischen  Grund- 
tatsache: bei  dem  nur  formalen  Charakter  der  I.  und  der  nicht 
v^ollständigen  Korrelation  der  in  ihr  enthaltenen  Teilfähigkeiten 
gibt  es  niemals  wirkliche  phänomenologische  Gleichartigkeit  der 
1.  bei  zwei  Individuen.  Wohl  aber  gibt  es  —  im  Hinblick  auf  die 
einheitliche  Zielsetzung  aller  L,  nämlich  die  Anpassung  an  neue 
Anforderungen  —  eine  teleologische  Gleichwertigkeit.  Und  für 
diese  Gleichwertigkeit  trotz  fehlender  Gleichartigkeit 
soll  das  lA.  ein  Annäherungsmaß  darstellen. 

Die  Staffelstremnii;    hat   ühi'iüeiis  für  die  Bereclinuno-  des  lA.   noch  eine 
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methodologische  Folge,  die  oft  nicht  genügend  beachtet  wird.  Man  maß,  nm 
etwaige  Lücken  aus  niederen  Teststufen  auszugleichen,  stets  Tests  aus  höheren 
Jahrgängen  zur  Verfügung  haben.  Nun  enthält  z.  B.  die  ursprängliche  Reihe  von 
BS.  nur  Tests  bis  zur  Stufe  13;  deshalb  ist  es  nicht  möglich,  das  lA.  12  oder  13 
kori'ekt  zu  berechnen,  da  möglicherweise  Tests  aus  noch  höheren  Jahrgängen  das 
Gesamtergebnis  erhöht  hätten.  Man  wird  also  bei  Arbeiten  nach  BS.  08  die  Be- 
rechnungen nur  bis  lA.  11  führen  dürfen. 

Die  Staffelstreuung  liefert  noch  einen  anderen  Maßwert  als  das 
lA.,  nämlich  ihre  eigene  Streuungsbreite.  Ein  Kind,  bei  dem 
sich  die  Treffer  und  Versager  unregelmäßig  über  die  Tests  der 
Altersstaffeln  von  6  bis  zu  10  Jahren  verbreiten,  hat  zwar  das- 
selbe lA.,  aber  eine  ganz  andere  Streuungsbreite  als  ein  Kind,  bei 
dem  das  Durcheinander  von  Treffern  und  Versagern  nur  in  den 
Staffeln  von  7  bis  9  Jahren  vorkommt.  Bober  tag,  der  zuerst  auf 
die  "Wichtigkeit  der  verschiedenen  Staffelstreuung  aufmerksam 
wurde,  hat  dafür  eine  Berechnungsmethode  erdacht;  ich  selbst 
habe  eine  andere  Rechnungsweise  vorgeschlagen,  beide  sind  noch 
nicht  veröffentlicht. 

Aber  die  qualitativen  Unterschiede  der  Streuung  werden  auch 
hiermit  nicht  erreicht,  und  deshalb  wird  es  in  vielen  Fällen  nötig 
sein,  außer  den  beiden  Resultantenwerten  (lA.  und  Streuungs- 
breite) auch  eine  eingehendere  Analyse  der  Prüfung  zu  geben. 
Oft  wird  es  gerade  von  Wichtigkeit  sein,  festzustellen,  in  welchen 
Tests  eine  besondere  Rückständigkeit,  in  welchen  ein  besonderer 
Vorsprung  vorhanden  war.  Auch  die  Beobachtung  des  Kindes 
während  der  Prüfung  darf  mau  nicht  gering  schätzen,  denn  bei 
manchen  Tests  gibt  es  Verhaltungsweisen,  die  von  hohem  Interesse 
sein  können  (z.  B.  auch  für  die  medizinische  oder  pädagogische 
Beurteilung),  ohne  daß  dies  in  dem  Plus  oder  Minus  des  re- 
gistrierten Testergebnisses  zum  Ausdruck  käme.  Es  sei  hier  u.  a. 
auf  die  Art  der  Bildbeschreibung  und  auf  das  Aufzählen  von 
60  Worten  hingewiesen,  sodann  auf  das  Verhalten  des  Kindes  bei 
dem  Ordnen  der  fünf  gleichaussehenden,  aber  verschieden  schweren 
Kästchen.  Ob  hier  schließlich  die  richtige  Ordnung  getroffen  wird, 
ist  lange  nicht  so  wichtig,  wie  die  Beobachtung  des  kindlichem 
Benehmens  bei  der  Arbeit;  ob  und  wie  schnell  es  die  ungewohnte 
Aufgabe  erfaßt,  ob  es  nur  immer  zwei  Gewichte  vergleicht  oder 
jedes  Gewicht  beim  Einordnen  mit  allen  anderen  vergleicht  usw. 
So  ist  also  bei  diesen  Untersuchungen  vor  einem  bloßen  Jagen 
nach  Zahlenwerten  zu  warnen;  Rechnung  und  qualitative  Analyse 
müssen  sich  ergänzen,  wobei  natürlich  je  nach  der  Fragestellung 
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die  eine  oder  andere  Methode  bald  mehr,  bald  weniger  hervor- 
treten wirdi). 

Doch  kehren  wir  wieder  zum  lA.  zurück.  Seine  volle  Be- 
deutung entfaltet  dieser  Eesultantenwert  erst,  wenn  er  zu  anderen 
Tatbeständen  in  Beziehung  gesetzt  wird.  Und  zwar  kann  er  ent- 
weder anderen  Graduierungeu,  dem  Lebensalter,  der  Schulklasse, 
der  Schulleistung  zugeordnet  werden,  oder  man  kann  untersuchen, 
wie  er  mit  gewissen  qualitativen  Bedingungen  —  der  Bevölkerungs- 
schicht, der  Schulgattung,  der  Nation  usw.   —  variiert. 

Die  höchste  Bedeutung  hat  zweifellos  die  Beziehung  des  lA. 
zum  wirklichen  Lebensalter  (LA.)  des  Prüflings,  denn  da  mit 
■einem  gewissen  Lebensalter,  wie  schon  gesagt,  normalerweise  eine 
gewisse  L-Stufe  verbunden  ist,  so  gibt  die  Relation  lA.  zu  LA. 
die  Spannung  zwischen  vorhandener  und  geforderter  (als  Norm  zu 
erwartender)  I.  an  und  damit  einen  Ausdruck  für  den  Grad  der 
intellektuellen  Veranlagung   des  Prüflings. 

Diese  Spannung  wurde  bisher  durchweg  in  der  einfachen 
Form  der  Differenz  berechnet:  der  Wert  LA.  —  lA.  gab,  wenn 
negativ,  den  absoluten  Intelligenzrückstand  (IR.),  wenn  posi- 
tiv, den  Intelligenz vorsprung  des  Kindes  in  Jahresgraden  an. 
IR.  =  —  2  bedeutet  also :  das  Kind  ist  in  seiner  geistigen  Ent- 
wicklung um  zwei  Jahre  hinter  dem  normalen  Niveau  seines  Alters 
zurück. 

Welchen  Wert  die  Messung  des  IE.  insbesondere  für  die 
Untersuchung  nicht  normaler  Kinder  haben  muß,  liegt  auf  der 
Hand.  Freilich  hat  sich  neuerdings  gezeigt,  daß  die  einfache 
Differenz  hierzu  nicht  ausreicht,  weil  sie  bei  verschiedenen  Lebens- 
altern verschiedenes  bedeutet  (vergleiche  darüber  Abschnitt  4  a). 
Nur  dort,  avo  es  sich  um  Untersuchung  von  Kindern  ungefähr 
gleicher  Altersstufe  handelt,  kann  man  sich  mit  ihm  begnügen. 
Für  alle  anderen  Fälle  wird  weiter  unten  die  Einführung  des 
Intelligenzquotienten  empfohlen  werden.  Er  gibt  nicht  die 
Differenz,  sondern  das  Verhältnis  von  lA.  zu  LA.  an,  ist  daher 
in  gewissem  Umfang  von  der  absoluten  Höhe  des  LA.  unabhängig. 

lA  • 

Die  Formel  lautet  IQ.  =  ^~- .     Der  Wert  ist  bei  den  Kindern,  die 

LA. 

durchaus  auf  normalem  Niveau  stehen  =  1,  bei  den  Kindern  mit 


^)  Ausführlichere  Analysen  des  kindlichen  Verhaltens  zu  den  B.-Tests  liegen 
bisher  vor  von  Bobertag  {-40)  und  Chotzen  (44). 
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Intelligenzvorsprung  größer  als  1,  bei  Kindern  mit  Intelligenz- 
rückstand ein  echter  Bruch.  Je  stärker  der  Schwachsinn,  um  so 
geringer  der  Bruchwert. 

Ein  letzter  Begriff,  der  aus  dem  lA.  hervorgeht,  ist  der  des 
I.-Stillstandes.  Er  gilt  nur  für  schwachsinnige  Individuen  und 
■bedeutet  dasjenige  lA.,  welches  auch  bei  fortwährend  steigendem 
LA.  nicht  überschritten  wird. 

3.  Ergebnisse  bei  normalen  Kindern. 
Die  Untersuchungen  normaler  Kinder  sind  die  Vorbedingung 
der  ganzen  Methode,  denn  an  normalen  muß  ja  erst  der  Kanon  für 
jedes  Alter  festgesetzt  werden.  Zugleich  aber  haben  diese  Unter- 
suchungen doch  schon  eine  Reihe  von  Ergebnissen  gezeitigt,  die 
den  künftigen  Wert  der  IP.  für  Probleme  der  Normalpädagogik 
nicht  gering  anschlagen  lassen.  Bisher  sind  hauptsächlich  Volks- 
schulkinder beiderlei  Geschlechts  und  verschiedener  Altersstufen, 
gelegentlich  aber  auch  Schüler  höherer  Schulen  geprüft  worden. 

a)  Gesamtverteilung  der  Intelligenzgrade.  Dort,  wo 
eine  größere  Anzahl  von  Kindern  der  normalen  Volksschulen  aus 
verschiedenen  Altersstufen  und  ohne  Vornahme  einer  besonderen 
Auslese  geprüft  worden  ist,  war  es  möglich,  eine  Gesamtstatistik 
darüber  aufzustellen,  wie  häufig  die  Kinder  auf,  über  und  unter 
dem  I.-Niveau  ihres  Alters  standen.  Ich  stelle  die  bisher  erzielten 
Häufigkeiten  in  Prozentzahlen  zusammen. 

Tabelle  I. 
Verteilung  der  Intelligenzgrade  ohne  Rüchsicht  auf  das  Lebensalter. 


Abstand  des  lA.  vom  LA.  in  Jahresgraden: 
—  2  —1  0  +1 


+  2 


Binet:  (203  Kinder)  ß^/o        21^ 


(261  Kinder 


Bobertae-  ^^OJ- ^^^^«^      ao' 
cooeitag.  ^^   ._^Q  j_^     4  ;o 


190/0 


20V2*^/o         l^/o 

22Vo«/n        2VoO/. 


Abstand  des  lA.  vom  LA.: 
—  2  u.  mehr     —  1      |        0        |      +  ^ 


-(-  2  u.  mehr 


Goddard:   ^J-^gL^^^'^f  H^       20V,^  |   41^2 °/o    |  21V. »/o       ö'k'lo 

Binet^)  hat  von  203  normalen  Kindern  (deren  Lebensalter  er  allerdings 
nicht  angibt)  eine  solche  Häufigkeitsverteilung  zusammengestellt,  "^'ir  können  daran 
eine    außerordentiiche   Symmetrie    bemerken:    ziemlich    genau    die    Hälfte    der 


1)  37,  S.  112. 
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geprüften  Kinder  war  auf  dem  Niveau,  ein  gutes  Viertel  darunter,  ein  knappes 
Viertel  darüber. 

Auf  dies  eigentümlich  einfache  und  symmetrische  Zahlenverhältnis  hat 
Bobertag  aufmerksam  gemacht,  der  es  zunächst  an  seinen  eigenen  Ergebnissen 
gefunden  hatte  und  dann  bei  Bin  et  bewährt  fand. 

Bobertag  veröffentlicht  soeben  seine  eigenen  Häufigkeitsziffern;  ich 
übernehme  dai-aus^)  die  Verteilungswerte  für  261  Kinder  zwischen  5  und  10 
Jahren.  "^iN'ährend  auch  hier  wieder  die  „Niveaukinder'  die  Hälfte  aller  Fälle 
ausmachen,  ist  zwischen  den  beiden  anderen  Gruppen  eine  unbedeutende  Ver- 
schiebung eingetreten;  es  sind  die  Vorgeschrittenen  etwas  stärker  vertreten  als 
die  Rückständigen. 

Eine  dritte  Statistik,  die  sich  auf  ein  Material  von  ganz  anderer 
Massenhaftigkeit  stützt,  besitzen  wir  von  Goddard  (48),  der  sämtliche 
Schulkinder  einer  kleinen  amerikanischen  Stadt  (Vineland  New- Jersey)  ge- 
prüft hat.  Freilich  ist  die  von  G.  aus  seinen  rohen  Ziffern  abgeleitete  Ver- 
teilungskurve 2)  nicht  brauchbar,  denn  er  bezieht  auch  die  Altersstufen  von 
12  Jahren  und  darüber  ein,  also  Kinder,  für  die  gar  nicht  mehr  genügend 
Tests  aus  höheren  Altersstufen  vorhanden  waren ;  es  mußte  dadurch  notwendig 
der  Eesultantenweit  für  diese  Prüflinge  herabgedrückt  werden.  Fassen  wir  nur 
die  Kinder  zusammen,  bei  denen  eine  genügende  Staffelstreuung  möglich  ist, 
also  solche  zwischen  4  imd  11  Jahi-en,  so  ergaben  sich  1277  Kinder,  für  die 
ich  die  prozentuellen  Häufigkeiten  berechnete.  Hier  ist  die  Häufigkeit  der 
Niveaukinder  etwas  heruntergegangen;  der  Prozentsatz  der  Vorgeschrittenen 
deckt  sich  ungefähr  mit  Bobertag;  dagegen  zeigen  die  unter  dem  Niveau 
stehenden  eine  deutliche,  wenn  auch  nicht  starke  Zunahme. 

Wenn  man  bedenkt,  daß  wir  es  bei  diesen  drei  Untersuchungen 
nicht  nur  mit  Kindern  verschiedener  Nationalität  zu  tun  haben, 
sondern  auch  mit  verschiedenen  Examinatoren,  deren  jeder  in 
der  Anstellung  und  Bewertung  der  Tests  seine  besonderen  Gesichts- 
punkte hat,  so  darf  man  die  Abweichung  der  drei  Statistiken  nicht 
allzu  hoch  einschätzen;  "nir  dürfen  aus  ihnen  den  Schluß  ziehen: 
eine  genügend  große  Anzahl  von  Kindern  verschiedener 
Lebensalter,  die  ohne  Auslese  geprüft  werden,  verteilen 
sich  in  bezug  auf  ihre  I.-Grade  einigermaßen  symmetrisch. 
Die  ungefähre  (in  Amerika  die  knappe)  Hälfte  steht  auf  dem  Niveau 
ihres  Alters,  je  etwa  ein  Fünftel  (bis  ein  Viertel)  ist  um  ein  Jahr 
rückständig  bzw.  voraus,  nur  ein  kleiner  Prozentsatz  (im  Höchst- 
fall 11  o/o)  zeigt  mehr  als  ein  Jahr  Kückstand,  und  ein  noch 
kleinerer  Bruchteil  (im  Höchstfall  51/2.^/0)  hat  einen  I.-Vorsprung 
von  mehr  als  einem  Jahr. 

Man  hüte  sich  übrigens,  das  „Niveaukind"  mit  dem  „Normal- 


')  40.  n.  Tab.  I. 
2)  S.  234. 
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kind''  gleichzusetzen;  im  Gegenteil,  gerade  die  Statistik  zeigt  ja, 
daß  die  Niveaukinder  nur  das  Mittelstück  der  Normalität  aus- 
machen, daß  aber  die  Kinder  mit  einem  Jahr  Rückstand  oder 
Vorsprung  noch  durchaus  der  Normalität  angehören. 

Bemerkenswert  ist,  daß  die  oben  gefundene  Verteilung  eine  gewisse 
Ähnlichkeit  mit  dem  einfachsten  Verteilungsgesetz  (der  Gauß sehen  Häufig- 
keitskurve) besitzt.  Denn  diese  ist  nicht  nur  eine  Symmetriekurve,  sondern 
sie  wird  auch  durch  den  Wert  der  ,, wahrscheinlichen  Abweichung"  in  drei 
Fraktionen  geteilt,  derart,  daß  die  INIittelfraktion  die  Hälfte  aller  Fälle,  die 
beiden  Seitenfraktionen  je  25  "/o  enthalten.  Bereits  vor  einem  Menschenalter 
hatte  Galton  die  Annahme  ausgesprochen,  daß  die  Begabungsgrade  einer 
großen  ungesiebten  Menschenmasse  nach  der  Gauß  sehen  Kurve  symmetrisch 
verteilt  sein  müßten.  Allerdings  glaubte  Galton,  ohne  weiteres  dasGaußsche 
Verteilungsgesetz  auf  eine  sehr  weitgehende  Stufengliederung  der  Begabungs- 
grade (16  Stufen)  anwenden  zu  dürfen,  während  die  Statistik  sie  bisher 
nur  für  einige  wenige  Hauptgruppen  wahrscheinlich  macht. 

Bobertag  fand  dann  noch  nachträglich,  daß  eine  ähnliche 
Verteilung  auch  anderwärts  statthat,  wo  eine  größere  Menschen- 
masse in  eine  gute,  mittlere  und  schwache  Gruppe  gegliedert  wird. 
Bei  einer  Zensurenstatistik,  die  sich  über  2772  Schüler  erstreckte, 
ergab  sich  nämlich,  daß  vorkamen:  Zensuren  besser  als  genügend 
in  25,70/0,  genügende  Zensuren  in  50,8  0/0,  Zensuren  unter  ge- 
nügend in  23,50/0  aller  Fallet). 

Man  möge  sich  aber  doch  hüten,  diesen  Verteilungsverhält- 
nissen eine  zu  große  Bedeutung  zuzuschreiben.  Erstens  reichen 
die  bisherigen  empirischen  Befunde  noch  lange  nicht  aus,  um  hier 
schon  die  Annahme  einer  allgemeinen  Gesetzmäßigkeit  zu  ge- 
statten; und  selbst  innerhalb  der  bisherigen  Befunde  gilt  die  For- 
mel nur  in  groben  Annäherungen  und  lediglich  als  Durchschnitts- 
wert aus  einer  ziemlich  großen  Individuenzahl,  in  der  viele  Un- 
regelmäßigkeiten kompensiert  sind  (vgl.  hierzu  den  nächsten  Ab- 
schnitt). Immerhin  ist  schon  das  bisher  Gefundene  interessant 
genug,  um  weiter  verfolgt  zu  werden  2). 

Als  heuristisches  Prinzip  aber  kann  jener  Verteilungs- 
gesichtspunkt schon  jetzt  von  Wert  sein  nach  zwei  Richtungen: 
1.  Wo  wir  gezwungen  sind,  eine  Menschenmasse  nach  ihrer 
geistigen  Leistungsfälligkeit  in  eine  gute,  mittlere  und  schwache 
Gruppe  zu  teilen,  kommt  die  bequeme  und  oft  gewählte  Einteilung 
in  drei  gleich  starke  Gruppen  sicherlich  weniger  den  wirklichen 


1)  40,  II,  Tab.  lY. 

2)  Näheres  über  obiges  Prinzip  der  symmetrischen  Verteilung  und  ihr 
Verhältnis  zur  Gaußschen  Kurve  enthält  1,  S.  248  ff.  und  Bobertag  40,  H. 
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Abstufungen    nahe,    als    die    Abspaltung   eines    guten    und    eines 
schlechten  Viertels  von  der  kompakten  mittleren  Hälfte. 

2.  Eine  Anforderung  (z.  B.  ein  Test  oder  eine  Testserie)  darf 
dann  für  eine  bestimmte  Menschengruppe  als  „normal"  gelten, 
wenn  ihr  ungefähr  75  o/o  der  Gruppenangehörigen  in  genügender 
oder  mehr  als  genügender  Weise  entsprechen.  Dieser  Gedanke 
ist  von   Bobertag  zur   Testeichung  verwandt   wordeni). 

b)  Die  verschiedenen  Altersstufen  und  Nationalitäten. 
Goddard  hat  geglaubt,  in  der  eben  besprochenen  Symmetriekurve 
den  Beweis  dafür  sehen  zu  dürfen,  daß  die  Testaufstellung  von 
BS.  gewissermaßen  eine  ideale  Serie  darstelle,  denn  sie  habe  ja 
empirisch  eine  Verteilung  geliefert,  die  a  priori  zu  erwarten  war. 
Aber  dieser  Schluß  ist  unberechtigt.  Die  Symmetriekurve  bezieht 
sich  zunächst  lediglich  auf  die  Gesamtheit  aller  Kinder  ohne  jede 
Rücksicht  auf  das  Lebensalter;  die  BS.-Tests  sollen  ja  aber  Nor- 
malkanons für  Kinder  je  einer  Altersstaffel  enthalten,  und  ihre 
Korrektheit  wäre  erst  dann  erwiesen,  wenn  sich  die  symmetrische 
Verteilung  bei  normalen  unausgewählten  Kindern  je  eines  Jahr- 
ganges zeigte.  Dies  ist  nun  aber  keineswegs  der  Fall,  und  zwar 
am  allerwenigsten  bei  Goddard.  Die  obige  Symmetriekurve  ist 
vielmehr,  wie  sich  bei  näherer  Betrachtung  erweist,  dadurch  zu- 
stande gekommen,  daß  die  verschieden  gerichteten  Ergebnisse  ver- 
schiedener Jahrgänge  einander  ungefähr  kompensieren  2),  Und 
zwar  stimmen  die  Ergebnisse  fast  aller  Nachprüfer  der  BS.-Methode 
unabhängig  von  der  Nationalität  darin  überein,  daß  die  für  die 
niederen  Jahrgänge  aufgestellten  Testserien  zu  leicht, 
die  für  die  höheren  zu  schwer  sind.  Die  mir  bekannten  Be- 
lege hierfür  sind  in  Tabelle  11  augegeben. 

Aus  Goddards*'),  Bob  er  tags*)  und  Miß  Johnstones  5)  Eoh- 
tabellen  berechnete  ich  die  Häufigkeitsprozentsätze  für  amerikanische,  deutsche 
und  englische  Kinder,  bei  Goddard  für  jeden  Jahrgang  gesondert,  bei  den 
beiden  anderen  wegen  der  kleineren  Personenzahl  für  je  zwei  bis  drei  Jahr- 
gänge  zusammen   (Tab.   II).    Man  sieht,   daß   sich  bei   den  jüngeren  Jahr- 

1)  Näheres  darüber  in  Abschnitt  5  a. 

2)  Hierauf  machte  bereits  Ayres  (31)  in  seiner  Kritik  Goddards 
aufmerksam. 

")  48,  S.  243.  ■•)  40.  II,  Tab.  I. 

**)  Die  Originalarbeit  von  Miß  Johnstone  (52)  enthält  kein  genügend  klares 
Zahlenmaterial;  wohl  aber  findet  sich  solches  bei  Bin  et  (36,  S.  196);  dort  wird 
die  Verteilungstafel  für  146  Volksschülerinnen  aus  Sheffield  nach  brieflichen 
Angaben  von  Miss  Johnstone  gegeben. 
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gängeu  viel  zu  viel  „Vorgeschrittene"  befinden;  bei  Goddard  und  John- 
stone übeltrafen  sie  an  Zahl  nicht  nur  die  „Rückständigen",  sondern  sogar 
die  Niveaukiuder.  So  stand  bei  Goddard  z.  B.  mehr  als  die  Hälfte  aller 
fünfjährigen  Kinder  auf  einem  lA.  von  6  Jahren  und  mehr.  Daraus  er- 
gibt sich  zur  Evidenz,  daß  die  Tests  viel  zu  leicht  sind.  Bei  Bobertag  ist 
die  Asymmetrie  nicht  so  stark. 

Tabelle  IL 


Es  standen 
unter    |       auf 
dem  Niveau  ihi*es 

über 
Alters 

bei  Goddard: 

5  jährige 

6  „ 

7  „ 

8  „ 

9  „ 

10  „ 

11  „ 

120/o 
2OV2O/0 
130/0 
440/0 
400/0 

560/o 

350/0 
300/0 
58o/o 

41°/o 
28o/o 
560/o 
360/o 

530/0 

49V//o 

290/0 
150/0 
320/0 

16^2^ 

8"/o 

bei  Bobertag: 
5 — 6  jährige 
7—8      ., 
9-11    .. 

11  "/o 

7"/o 

340/0 

6O0/0 

500/0 

290/0 

44^2  o/o 

I60/0 

bei  Miß  Johnstone: 
6  u.  7  jährige 
8  u.  9     „ 
10  u.  11    „ 

120/0 
200/0 
62  0/0 

200/0 
400/0 
250/0 

680/0 
400/0 
130/0 

Der  zu  hohe  Prozentsatz  der  Vorgeschrittenen  (also  die  zu  große 
Leichtigkeit  der  Tests)  erstreckt  sich  bei  Goddard  bis  zu  7,  bei  Bobertag 
bis  zu  8  Jahren  einschließlich;  bei  Johns  tone  ist  sie  sogar  noch  bei 
9  Jahren  nicht  ganz  verschwunden.  Dann  kommt  plötzlich  die  Umkehrung; 
in  den  höheren  Jahrgängen  häufen  sich  die  Rückständigen,  die  Tests  sind 
also  zu  schwer. 

Bei  den  155  Vei-suchspersoneu  von  Bloch  und  Preiß  (38)  war  von  vorn- 
herein eine  Auswahl  in  der  Weise  getroffen  worden,  daß  nur  Kinder  mit 
mittlerer  I.  und  Schulleistung  geprüft  wurden.  Infolgedessen  kamen  Rück- 
stände des  lA.  fast  gar  nicht  vor,  wohl  aber  Vorsprünge;  diese  nehmen 
jedoch  mit  steigenden  Jahren  ab.  Aus  den  angegebenen  Zahlen  läßt  sich 
berechnen,  daß  über  dem  Niveau  des  Lebensalters  standen:  volle  50 "/o  der 
7jährigen,   20°lo   der  8-   und   9jährigen,   nur  14 0/0   der   10-   und   11  jährigen. 

TabeUe  III. 


Terman  und  Childs: 
durchschnitthches 
LA.         I         lA. 
einiger  Jahrgänge 


4,75 

7,5 

12,33 


6,5 

8 
11 
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Eine  andere  Rechnungsweise,  aber  das  gleiche  Ergebnis  finden  wir  bei 
den  Amerikanern  Ter  man  und  Childs  (64)  und  bei  der  Genferin  Des- 
coeudres  (46).  Die  erstgenannten  prüften  396  nicht  ausgewählte  Kinder 
und  berechneten  die  Durchschnittswerte  jeder  Altersstufe;  hiemach  geraten 
die  kleinen  Kinder  auf  ein  viel  zu  hohes,  die  großen  auf  ein  zu  niedriges 
Durchschnittsniveau  der  I.,  so  daß  im  ganzen  die  I.-Niveaus  viel  weniger 
voneinander  abweichen  als  die  Lebensjahre.  Die  Tests  bringen  demnach  die 
wirklich  vorhandenen  Unterschiede  der  Kinder  nicht  in  vollem  Maße  zum 
Ausdruck.  Descoeudres  hatte  im  ganzen  nur  24  Kinder"  aus  6  Jahr- 
gängen geprüft;  hier  ergaben  sich  zwischen  den  Kindern  der  untersten  und 
obersten  Klasse  Differenzen  des  lA.  von  nur  2 — 4  Jahren,  während  die 
Lebensalter  um  etwa  6  Jahre  differierten. 

Alle  diese  Befunde  zeigen  zunächst,  daß  die  Anordnung  der 
Tests,  wie  sie  Binet  und  Simon  1908  gaben,  an  nicht  unbeträcht- 
lichen Fehlern  leidet,  die  beseitigt  "werden  müssen.  Binet  selbst 
hat  noch  diesen  Mangel  wenigstens  zum  Teil  anerkannt,  indem 
er  später  die  Tests  für  11-,  12-  und  13  jährige  auf  höhere  Alters- 
stufen verlegte. 

Aber  weit  wichtiger  ist  ein  positives  Ergebnis:  die  inter- 
nationale Übereinstimmung  in  dem  Urteil  über  die  zu  große 
Leichtigkeit  bzw.  Schwierigkeit  gewisser  Teststaffeln.  Es  ist  doch 
wahrlich  nichts  Kleines,  daß  die  Tests  der  Sechsjährigen  ebenso 
den  amerikanischen  wie  den  deutschen,  französischen  und  eng- 
lischen Volksschulkindern  zu  leicht,  die  der  Elfjährigen  ebenso 
durchgängig  zu  schwer  waren,  und  daß  bei  den  Tests  für  Acht- 
bis  Neunjährige  eine  Mittelzone  zu  bestehen  scheint.  Trotz  der 
Unterschiede  in  Easse  und  Sprache,  trotz  der  Abweichungen  des 
Schulwesens  und  der  unterrichtlichen  Maßnahmen  eine  so  große 
Übereinstimmung  in  der  Eeaktion  der  Kinder  —  das  ist  meines 
Erachtens  die  beste  Eechtfertigung  des  Testprinzips,  die  man 
sich  denken  kann;  denn  diese  Übereinstimmung  beweist  doch,  daß 
durch  die  Tests  nicht  irgend  welche  von  außer  her  beigebrachten 
Kenntnisse  und  Fertigkeiten,  sondern  tatsächlich  die  allgemeinen 
Entwicklungsbedingungen  der  Intelligenz  getroffen  wer- 
den, so  wie  sie  inderVolksschuIjugeuddes  modernen  Kulturkreises 
wirksam  sind.  Und  diese  Bewährung  des  Prinzips  darf  uns  auch 
getrost  machen  in  der  Hoffnung,  die  gleichfalls  nachgewiesenen 
Mängel  in  den  Einzelheiten  künftig  beseitigen  zu  können. 

c)  Kinder  verschiedener  sozialer  Schichten.  Anders 
als  mit  den  nationalen  Unterschieden  steht  es  mit  den  sozialen 
Differenzen:  sie  prägen  sich  mehr  oder  minder  deutlich  in  dem 
Testausfall    aus. ,   Das   Problem,    Kinder    aus    verschiedenen  Be- 
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Völkerungsschichten  vergleichend  mittels  der  Staffeltests  zu  prüfen, 
wurde  um  das  Jahr  1910  gleichzeitig  von  Bineti)  und  von 
Breslauer  Lehrern  in  Angriff  genommen. 

Binet  kam  auf  die  Frage  durch  einen  äußerlichen  Anlaß. 
Untersuchungen,  vrelche  Decroly  und  Mlle.  Degand  in  einer 
Brüsseler  Privatschule  mit  seiner  Methode  angestellt  hatten  (45), 
waren  zu  Ergebnissen  gekommen,  die  zum  Teil  den  "Wert  seiner 
Tests  in  Frage  zu  stellen  schienen,  da  sich  diese  als  durchweg  zu 
leicht  erwiesen.  Von  sämtlichen  45  geprüften  Kindern  war  näm- 
lich kein  einziges  unter  dem  Niveau,  9  auf  dem  Niveau  und  die 
übrigen  über  dem  Niveau  (13  um  ein  Jahr,  17  um  zwei  Jahr, 
9  sogar  um  drei  Jahr)^).  Mit  Eecht  weist  nun  Binet  darauf  hin, 
daß  diese  Zahlen  keinen  Beweis  gegen  den  "Wert  der  Tests  überhaupt, 
sondern  einen  positiven  Beitrag  zum  Studium  der  sozial  bedingten 
Differenzierung  darstellen.  Denn  die  belgischen  Kinder  stammten 
sämtlich  aus  Kreisen  des  gebildeten  Mittelstandes,  die  Pariser 
Kinder  aber,  auf  welche  die  Tests  zugeschnitten  waren,  gehörten 
dem  niederen  Volke  an.  Binet  berechnet  hiernach  den  durch- 
schnittlichen Unterschied  im  Intelligenzalter  zwischen  Kindern 
der  höheren  und  niederen  Stände  auf  ungefähr  11/2  Jahre.  Diese 
Zahl  kann  natürlich  nur  einen  ganz  groben  Annäherungswert  be- 
deuten; sie  wird  vor  allem  bei  verschiedenen  Stufen  des  Lebens- 
alters sehr  verschieden  sein,  worauf  Binet  bedauerlicherweise 
keinen  Bezug  nimmt. 

Binet  veranlaßte  nun  einige  Schulleiter  seiner  Bekanntschaft, 
der  Frage  auch  in  Paris  nachzugehen.  Allerdings  ließ  man  Kinder 
höherer  Schulen  beiseite  und  suchte  nur  festzustellen,  ob  sich  auch 
innerhalb  der  Volksschule  ein  Einfluß  der  sozialen  Umwelt 
feststellen  ließe.  Leider  sind  diese  Proben  nur  an  einer  außer- 
ordentlich  geringen   Kinderzahl   angestellt  worden. 

Ohne  Ergebnis  blieb  eine  Untersuchung  (S.  194),  welche  sich  auf  eine 
einzige  Schule  beschränkte,  aus  der  54  Kinder  geprüft  und  nach  4  Graden 
der  sozialen  Lage  gegliedert  wurden.  Daß  sich  gerade  unter  den  ärmsten 
Kindern  relativ  mehr  Individuen  mit  vorgeschrittener  Intelligenz  fanden 
als  unter  den  anderen,  mag  Zufall  sein;  jedenfalls  aber  fehlt  jede  Spur 
einer  positiven  Beziehung  zwischen  lA.  und  sozialer  Lage.  Vermutlich  sind 
die  hier  vorliegenden  sozialen  Differenzen,  wie  schon  Binet  selbst  hervor- 
hebt, zu  gering,  um  einen  Ausschlag  zu  geben. 

Deutlich  war  dagegen  wieder  der  L^nterschied  beim  Vergleich 


')  36,  S.  187. 

^)  Vgl.  das  Eeferat  von  Bobertag,  ZÄ?igPs  S.  205. 
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von  zwei  verschiedeneu  Volksschulen  (S.  198),  deren  eine  im 
ärmsten  Viertel  von  Paris,  die  andere  in  einer  relativ  wohlhabenden 
Gegend  lag.  Aus  jeder  Schule  wurden  30  Kinder  entsprechender 
Altersstufen,  die  ohne  Rücksicht  auf  die  Schulleistungen  aus- 
gewählt waren,  gepräft.  Tabelle  IV  zeigt,  um  wieviel  zahlreicher 
die  rückständigen  Intelligenzen  in  der  ärmeren  Schule  waren. 
Binet  berechnete  hier  den  durchschnittlichen  Vorsprung  des  lA. 
bei  den  besser  situierten  Volksschülern  auf  3  4  Jahr. 

TabeUe  IV. 


Rückst,  lun 
2J.    I    IJ. 


•I 
Niveau 


IJ.       2J. 


Je  30  Volksschüler  /  in  sehr  armer  Gegend 
einer  Schule      \  in  guter  Gegend      .     . 


1  11         13 

1      !       3    !     10 


4  1 

10  6 


Eine  Frage,  ebenso  interessant  wie  schwer  zu  beantworten 
ist  die  nach  den  Ursachen  dieser  Leistimgsunterschiede. 
Offenbar  wäre  es  sehr  voreilig,  wollte  man  nun  bereits  als  sicher 
erwiesen  annehmen,  daß  die  eigentliche  I.  als  angeborene  geistige 
Fähigkeit  bei  den  Kindern  der  niederen  und  ärmeren  Schichten 
einen  tieferen  Grad  habe.  Ganz  ausgeschlossen  ist  die  Beteiligung 
dieses  Ursachfaktors  freilich  nicht.  Man  könnte  etwa  annehmen, 
daß  schon  das  Aufsteigen  in  die  höheren  und  wohlhabenderen 
Stände  nur  auf  Grund  einer  gewissen  intellektuellen  Auslese  mög- 
lich sei,  und  daß  daher  die  Kinder  dieser  Schichten  schon  erblich 
eine  höhere  Intelligenzdisposition  mitbrächten. 

Aber  man  darf  doch  andererseits  nicht  vergessen,  daß  keine 
Testserie,  sei  sie  auch  noch  so  geschickt  ausgewählt,  die  nackte 
angeborene  Intelligenzdisposition  selber  trifft,  sondern  diese  Dis- 
position in  Verbindung  mit  all  den  Einflüssen,  unter  denen  der 
Prüfling  bis  zum  Moment  der  Prüfung  gestanden  hat.  Und  eben 
diese  äußeren  Einflüsse  sind  bei  den  niederen  Schichten  andere. 
Die  Kinder  der  höheren  Stände  sind  viel  häufiger  mit  Erwach- 
senen zusammen,  werden  vielseitig  angeregt, '  auch  mit  Denkauf- 
gaben in  Spiel  und  Unterhaltung  beschäftigt,  gewinnen  einen  ganz 
anderen  Wortschatz  und  eine  bedeutende  Sprachbeherrschung,  emp- 
fangen besseren  Schulunterricht;  all  dies  muß  bewirken,  daß  sie 
den  Testanforderungen  besser  gegenüberstehen,  als  die  Kinder  aus 
ungebildeten  Schichten. 

Vermutlich  werden  ja  beide  Faktoren,  der  innere  und  der 
äußere,  an  dem  Ergebnis  beteiligt  sein;  genauere  Einsichten   in 
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die  tatsächliche  EinfliLßsphäre  des  einen  oder  des  anderen  wird 
man  aber  erst  nach  sehr  viel  umfangreicheren  Untersuchungen 
erwarten  dürfen.  Der  Weg  dazu  besteht  in  einer  spezielleren  Ana- 
lyse der  Ergebnisse ;  man  wird  feststellen  müssen,  in  welchen  Tests 
sich  vor  allem  die  Überlegenheit  der  Kinder  gebildeter  Schichten 
zeigt  und  welche  Tests  von  beiden  Gruppen  gleichmäßig  gelöst 
werden. 

Aus  den  Tabellen  von  Decroly  und  Degand  zieht  Binet^)  das 
Material  zu  einer  ersten  solchen  Vergleichung.  Bemerkenswerterweise  sind 
hiernach  die  besser  situierten  Kinder  besonders  voraus  in  Tests,  die  recht 
eigentlich  die  Denkfunktionen:  Auffassung,  Vergleichung,  Kritik,  Begriffs- 
bildung, Synthese,  freilich  meist  auch  sprachHche  Gewandtheit  beanspruchen; 
es  sind  che  Tests:  Bildbeschreibung  und  -erklärung,  Vergleichung  zweier 
Gegenstände,  Definition  abstrakter  Begriffe,  Erkennen  von  Lücken  in  Figuren, 
Kritik  absurder  Sätze,  Ordnen  von  5  Grewichten,  Finden  von  60  Worten 
in  drei  Minuten.  Dazu  kommen  einige  Tests,  die  offenbar  mehr  von  äußeren 
Bedingungen  abhängen:  Kenntnis  der  Wochentage,  Monatsnamen,  Münzen. 
Als  Tests  dagegen,  die  nur  geringe  soziale  Differenzierung  zeigen,  erwähnt 
Bin  et  meist  solche,  die  auf  Schulwissen  zurückgehen:  Abschreiben  und  Nach- 
Diktat-Schreiben, Rückwärtszählen,  auf  zwanzig  Sous  herausgeben,  Rhombus- 
zeichnen; als  eigentlicher  I-Test  figuriert  hier  nur  ein  einziger:  Ergänzung 
von  Textlücken.  —  Bei  der  geringen  Anzahl  von  Kindern,  die  diesen  Er- 
gebnissen zugrunde  gelegt  werden  konnte,  verbietet  sich  aber  jede  Verallge- 
meinerung der  Befunde. 

Das  Problem  der  sozialen  Differenzierung  und  ihres  Ein- 
flusses auf  die  I.  führt  unmittelbar  zu  praktisch  pädagogischen 
Gesichtspunkten  hinüber;  mau  denke  nur  an  die  Forderung  der 
Einheitsschule,  welche  die  Kinder  aller  sozialen  Schichten  unter- 
schiedslos umfassen  will.  Mir  scheint,  daß  bei  den  einschlägigen 
Diskussionen  —  ähnlich  wie  beim  Problem  der  gemeinsamen  Er- 
ziehung der  Geschlechter  —  die  eigentlich  psychologischen  Vor- 
aussetzungen viel  zu  wenig  berücksichtigt  werden,  weil  man  allein 
die  sozialethische  Seite  der  Frage  im  Auge  hat. 

Wie  aber  die  psychologischen  Methoden  der  IP.  unmittelbar 
in  den  Dienst  jener  praktischen  Fragen  treten  können,  das  wird 
hoffentlich  eine  Untersuchung  erweisen,  die  gegenwärtig  von  einer 
Gruppe  Breslauer  Lehrer  nach  der  BS.-Methode  unternommen  wird. 
Es  handelt  sich  um  eine  systematische  Vergleichung  von  Volks- 
schülern mit  Vorschülern  (d.  h.  den  Zöglingen  einer  Gymnasial- 
vorschule). Es  soll  festgestellt  werden,  ob  zwischen  gleichaltrigen 
Kindern   beider   Gruppen   typische  I.-Unterschiede  bestehen,   und 

1)  36,  S.  191. 
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welche  Größe  diese  auf  verschiedenen  Altersstufen  haben.  In 
Preußen  berechtigt  dreijähriger  Besuch  der  Vorschule,  aber  erst 
vierjähriger  der  Volksschule  zum  Eintritt  in  die  Sexta  des  Gym- 
nasiums; auch  das  sollte  gepmft  werden,  inwieweit  diese  Maß- 
regel nicht  nur  durch  den  hier  und  dort  bewältigten  Lehrstoff, 
sondern  auch  durch  die  allgemeine  geistige  Reife  der  Kinder 
psychologisch  gerechtfertigt  ist. 

Es  wurden  fünf  Gruppen  geprüft,  die  bezüglich  des  Alters 
sorgfältig  vergleichbar  gemacht  wurden,  7-  und  9  jährige  Vor- 
schüler, 7-,  9-  und  10  jährige  Volksschüler,  im  ganzen  ungefähr 
150  Knaben.  (Über  gewisse  bei  der  Prüfung  gewahrte  Vorsichts- 
maßregeln siehe  oben,  S.  24.)  Die  Ergebnisse  werden  gegenwärtig 
verarbeitet;  doch  verdanke  ich  der  Freundlichkeit  der  IJntersucher 
bereits  einige  Daten,  aus  denen  ich  die  folgende  Berechnung 
(Tab.  V)  ableitete.  Diese  Zahlen,  die  als  durchaus  provisorische 
zu  gelten  haben,  geben  lediglich  an,  in  welcher  prozentualen 
Häufigkeit  die  Gesamtheit  der  Tests,  über  welche  mir  Daten  vor- 
liegen, gelöst  worden  sind,  und  zwar  auch  nur  für  die  drei  älteren 
Schülergruppen  ^). 

Die  erste  Rubrik  zeigt,  daß  die  9  jährigen  Volksschüler  be- 
züglich der  Anzahl  der  gelösten  Tests  hinter  den  gleichaltrigen 
höheren  Schülern  um  10  o/o  zurückstehen,  während  die  10  jährigen 
Volksschüler  die  Prozentzahl  der  um  ein  Jahr  jüngeren  Vorschüler 
erreichen.  Daß  aber  auch  hier  keine  wirkliche  Gleichwertigkeit 
vorliegt,  erweisen  die  beiden  anderen  Rubriken,  in  denen  die 
Prozentzahlen  für  die  leichteren  Tests  (Staffeln  9  und  3  0)  und 
für  die  schwereren  (Staffeln  11  und  12)  gesondert  berechnet  sind. 
Während  bei  den  leichteren  Aufgaben  die  Vorschüler  sonderbarer- 
weise sogar  den  gleichaltrigen  Volksschülern  um  ein  weniges,  den 
älteren  um  9  o/o  nachstehen,  ändert  sich  das  Bild  sofort  bei  den 
schwereren  Anforderungen.  Diese  über  dem  Altersniveau  der  Prüf- 
linge liegenden  Tests  werden  von  den  Vorschülem  in  fast  doppelt 
so  hoher  Zahl  gelöst,  wie  von  ihren  Altersgenossen  aus  der  Volks- 
schule ;  und  selbst  die  älteren  Volksschüler  stehen  hierin  noch  um 
18  o/o  hinter  den  jüngeren  Vorschülern  zurück.  Sollte  sich  dieses 
interessante  Ergebnis  auch  in  den  definitiven  Berechnungen  be- 
stätigen, was  zu  erwarten  ist,  so  würde  es  heißen:  die  Kinder  ver- 


1)   Für   manche   sehr   wichtige   Tests,   wie   z.    B.    die   Bildbeschreibung, 
liegen  mir  noch  keine  Ergebnisse  vor. 
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schiedener  sozialer  Schichten  unterscheiden  sich  weniger  in  den 
ihrem  Alter  adäquaten  Leistungen  als  in  der  Bewältigung  von  Auf- 
gaben, die  eigentlich  über  dem  Niveau  ihres  Alters  liegen.  Wir 
hätten  also  einen  zahlenmäßigen  Beweis  für  jene  bekannte  Früh- 
reife der  Kinder  höherer  Stände,  für  die  Vorwegnähme  von  Er- 
scheinungen künftiger  Entwicklungsphasen,  ehe  der  Inhalt  der 
eben  verlaufenden  Entwicklungsphase  schon  voll  ausgeschöpft  ist. 
Man  wird  dem  endg-ültigen  Ergebnis  dieser  Untersuchungen 
mit  Interesse  entgegensehen  dürfen. 


Tabelle  Y 

• 

Richtig  gelöste  Tests  der  Staffehi 
9—12              9  u.  10            11  u.  12 

9  jährige  Vorschüler 

700/o 

770/0 

€4«/o 

9      ..        Yolksschüler 

10  ;, 

60«/o 
70«/o 

81  «/o 
86% 

34«/o 
460/o 

Zugleich  ist  obiger  Befund  wieder  eine  Bestätigung  eines 
Gesetzes  der  differentiellen  Psychologie:  je  komplizierter  eine 
ps3"chologische  Funktion  imd  je  schwieriger  ihre  Ausführung  ist, 
je  später  sie  ferner  in  der  Entwicklung  auftritt,  mn  so  größer  ist 
auch  ihre  Variabilität,  und  um  so  deutlicher  differenzieren  sich 
die  Menschen  und  Menschengruppen  nach  ihr  (vgl.  1.,  S.  258  und  269). 

d)  Intelligenz  und  Schulleistung.  Das  Verhältnis  dieser 
beiden  Momente  ist  wohl  dasjenige  Problem  unseres  Grebietes,  das 
für  die  praktische  Pädagogik  am  wichtigsten  ist;  denn  hier  dürfen 
wir  hoffen,  einen  Einblick  in  die  Faktoren  zu  gewinnen,  welche 
das  Fortkommen  der  Kinder  in  der  Schule,  den  Platz,  den  sie  auf 
Grund  ihrer  Leistungen  unter  ihren  Mitschülern  einnehmen,  den 
Ausfall  ihrer  Zeugnisse  bedingen.  Man  ist  im  allgemeinen  geneigt, 
die  Beziehung  dieser  schulischen  Leistungsfähigkeit  zur  intellek- 
tuellen Leistungsfähigkeit  für  eine  sehr  enge  zu  halten:  gute 
Schüler  werden  von  vornherein  als  intelligent  angesehen,  und  von 
intelligenten  Kindern  werden  mit  einer  gewissen  Selbstverständ- 
lichkeit gute  SchuUeistungen  erwartet,  entsprechend  bei  den 
schlechten  Gruppen.  Solange  wir  freilich  keine  besonderen  Prü- 
fungsmittel der  I.  hatten,  fehlten  alle  Grundlagen  für  eine  exaktere 
Kenntnis  dieser  Verhältnisse;  man  mußte  sich  mit  Vermutungen 
oder  mit  Verallgemeinerungen  gelegentlicher  Beobachtungen  be- 
gnügen. 
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Nunmehr  beginnen  wir  hier  festeren  Grund  zu  gewinnen; 
schon  jetzt  lehren  die  IP.,  daß  die  Beziehungen  zwischen  I. 
und  Schulleistungsfähigkeit  durchaus  nicht  so  eng  und 
eindeutig  sind,  wie  man  meist  geglaubt  hatte.  Hier  gehen  uns 
nur  die  mit  der  BS.-Methode  gewonnenen  Befunde  bei  normalen 
Kindern  an,  aber  es  wird  uns  das  gleiche  Ergebnis  noch  an  zwei 
späteren  Stellen  (11,  4  c  und  III,  3)  begegnen. 

Für  die  schulische  Kapazität  eines  Kindes,  die  wir  mit  seiner 
I.  vergleichen  wollen,  haben  wir  zwei  Maße,  das  Klassenalter  (KA.) 
und  die  Zensur. 

Das  KA.  ist  das  normale  Alter  der  Klasse,  der  das  Kind  an- 
gehört. Nehmen  wir  das  Alter  von  6  Jahren  als  Schulbeginn  an, 
so  ist  das  KA.  einer  Klasse,  die  eben  in  das  vierte  Schuljahr  tritt, 
6  -f-  3  =  9  Jahre.  Befindet  sich  in  dieser  Klasse  ein  Kind  von 
11  Jahren,  so  hat  es  einen  Schulrückstand  von  2  Jahren,  dagegen 
hat  ein  achtjähriger  Klassengenosse  einen  Schulvorsprung  von 
1  Jahre.  Schulvorsprünge  sind  bei  uns,  wegen  des  genau  geregelten 
Versetzungsturnus,  sehr  selten;  sie  kommen  höchstens  vor,  wenn 
Kinder  nach  privater  Vorbereitung  oder  von  einer  anderen  Schule 
her  eingeschult  werden  (im  Ausland  scheinen  sie  häufiger  zu  sein). 
Schulrückstände  sind  dagegen  recht  häufig  infolge  des  Sitzen- 
bleibens, ferner  durch  längere  Erkrankung  usw. ;  sie  gewinnen 
gelegentlich   einen  ziemlich   hohen   Grad. 

Vergleichungen  des  KA.  mit  dem  lA.  liegen  vor  von  Bin  et 
und  von  Goddard. 

TabeUe  VI. 


Die  Intelligenz  stand 
Binet  !    unter    [       auf      ]     über 

!'  dem  Niveau  des  Lebensalters 


Summa 


14       I         9       !         1 


24 


Klassenalter  '.  Normalität  .     .     .     .   j       16        !       33  16       j|       65 

zeigte        [  Vorsprang  ....  I  0        '         ö        j  7        ;       12 


Summa  !'       .SO  47  24  101 


Binet  1)  gibt  eine  Verteiluugstafel  von  101  Kindern  und  hält 
die  Übereinstimmung  für  ziemlich  befriedigend  (Tab.  VI).  In  der 
Tat  ist  wenigstens  das  Fehlen  paradoxer  Fälle  zu  bemerken:  kein 
einziges  Kind  mit  I.-Rückstand  zeigt  Schulvorsprünge,  und  nur 
ein  einziges  Kind  mit  I.-Vorsprung  zeigt  Schulrückstand  (der  viel- 

1)  36,  S.  162. 
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leicht  durch  Krankheit  bedingt  sein  mag).  Aber  im  übrigen  sind 
doch  beträchtliche  Differenzen  da;  von  den  I.-Vorgeschrittenen 
zeigi  nur  ein  knappes  Drittel  auch  Schul vorsprung,  von  den  L- 


Eückständis-en    ist    nicht 


einmal  die  Hälfte  zugleich 


schulrück- 


ständig; und  die  schulnormalen  Kinder  stehen  zu  einem  Viertel 
über,  zu  einem  Viertel  unter  dem  I.-Niveau  ihres  Lebensalters. 

Eine  exakte  Berechnung  dieser  Verhältnisse  ist  möglich  mit 
Hilfe  der  Kontiugenzmethode^).  Kontingenz  bedeutet  den  Grad  des 
Sichdeckens  zweier  sich  kreuzender  Gruppen.  Wenn  z.  ß.  alle 
Kinder  mit  Schulrückstand  auch  I.-Rückstand  zeigten  und  um- 
gekehrt, dann  wäre  die  Kontingenz  absolut  {=  1);  fänden  sich 
unter  den  Schulrückständigen  prozentuell  nicht  mehr  I.-Rück- 
ständige  als  unter  den  Kindern  mit  normaler  oder  höherer  Schul- 
fähigkeit, so  wäre  die  Kontingenz  =  0.  Durch  eine  Zahl  zwischen 
0  und  1  wird  der  Grad  der  Kontingenz  angezeigt.  Ich  berechnete 
nun  aus  obiger  Tabelle  folgende  Werte: 

Koni  (Schulrückstaud  — >■  I.-Rückstand)  =  0,41 
„       (I.-Rückstand  — ►  Schulrückstand)  =  0,30 
„       (Schulvorsprung  -~*  I.-Vorsprung)  =  0,45 
„       (I.-Vorsprung  — >  Schulvorsprmig)  =  0,19 
d.  h.  die  Kontingenz  hat  bestenfalls  eine  mittlere  Größe,  und  auch 
diese  nur  von  der  Schulfähigkeit  zur  I.  hin,  nicht  umgekehrt.   Von 
Abweichungen   der  I.    aus   kann   man   also    noch   weniger   einen 
ScMuß   auf  das  Schulniveau   ziehen   als   von   Abweichungen   des 
Schulniveaus  auf  die  I. 

Zu  einem  entsprechenden  Ergebnis  kam  Goddard  bei  seinem 
Massenversuch  (48) ;  er  fand,  daß  mehr  als  die  Hälfte  aller  geprüften 
Kinder  in  einer  Klasse  waren,  die  nicht  ihrem  lA.  entsprach,  und 
zwar  befanden  sich  die  meisten  von  diesen  in  einer  zu  tiefen  Klasse, 
nur  wenige  in  einer  zu  hohen. 

Tabelle  VII. 


Bobertag 

Die  Intelligenz  stand 
unter    |       auf      |     über 
dem  Niveau  des  Lebensalters 

Summa 

[schlecht 1       29 

Zensuren   {  genügend 1       26 

U"t 1      0 

17 
79 
13 

0 
21 
31 

46 

126 
44 

Summa 

1        55 

109 

52 

216 

1)    Die  Formel  ist  entwickelt  in :  1,  308  ff. 
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Deu  Vergleich  des  lA.  mit  den  Schulzens uren  zog  B ober- 
tag i).  Seine  Verteilungstafel  zeigt  wieder  das  Fehlen  der  para- 
doxen Fälle.  Im  übrigen  sind  seine  Kontingenz werte  nach  meiner 
Berechnung  höher  als  bei  Binet.  aber  doch  auch  nur  von  mitt- 
lerer Höhe: 

Kont.  (schlechte  Zensur  — *  I.-Rückstand)  =  0.52 
„  (I.-Rückstand  — >  schlechte  Zensur)  =  0,40 
,,  (gute  Zensur  — -  I.-Vorsprung)  =  0,59 
,,       (I.-Vorsprung  — ►  gute  Zensur)         =  0.47 

Auch  hier  wiederholt  sich,  daß  der  Schluß  von  der  Schul- 
leistung auf  die  I.  sicherer  ist  als  umgekehrt,  aber  immerhin 
sind  hier  die  Kontingenzen  von  der  I.  zur  Zensur  nicht  mehr  so 
klein  wie  oben  bei  Binet. 

Vas  bedeutet  nun  diese  Unvollständigkeit  in  der  Überein- 
stimmung zwischen  der  Schulleistungsfähigkeit  und  dem  Ausfall 
der  IR? 

Man  könnte  einerseits  sagen,  es  sei  dies  wiederum  ein  Beweis 
für  die  Mangelhaftigkeit  der  Tests.  Denn  da  das  Schulalter  und 
die  Zensur  der  verdichtete  Ausdruck  für  die  chronische  und  sehr 
vielfältige  Leistungsfähigkeit  des  Kindes  und  daher  viel  charak- 
teristischer seien  als  der  Ausfall  einer  halbstündigen  Testprüfung, 
so  sei  der  letzteren  nur  dann  Vertrauen  zu  schenken,  wenn  sie 
sich  mit  jener  decke;  tue  sie  es  nicht,  so  taugen  eben  die  Tests 
oder  wenigstens  die  auf  ihnen  aufgebauten  Graduieningen  nichts. 

Nun  haben  wir  ja  schon  oben  die  Schwächen  der  bisherigen 
Graduierung  nach  BS,  nachgewiesen,  und  es  ist  zweifellos,  daß 
diese  auf  die  Unstimmigkeit  mit  den  Schulleistungen  mit  ein- 
gewirkt haben ^).  Denn  da  z.  B.  die  Tests  für  Siebenjährige  zu  leicht 
sind,  werden  auch  viele  weniger  begabte  Kinder  von  sieben  Jahren 
nach  der  Prüfung  noch  das  Niveau  ihres  Alters  erreichen, 
während  sie  in  der  Schule  nicht  ..genügend"  stehen.  Umgekehrt 
bei  den  älteren  Kindern.  Ich  glaube  indessen  nicht,  daß  dies  die 
einzige  Ursache  der  Unstimmigkeit  sei;  der  Grund  liegt  tiefer. 

Man  kann  andererseits  meinen,  daß  nur  die  Tests  ein  wirk- 
liches Büd  der  geistigen  Veranlagung  geben,  und  daß  daher  die 
ganze  Schuld  an  jener  Unstimmigkeit  der  Schule  zugeschrieben 
werden  müsse;  die  Lehrer  hätten  eben  die  Schüler  falsch  beurteilt. 


')  40,  n,  S.  501.  Tab.  II. 

-)  Dies  wird  auch  von  Bobertag  a.  a.  0.  nachgewiesen. 
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wenn  sie  ihnen  Zensuren  gegeben  hätten,  die  nicht  ihrem  I.- 
Niveau entsprächen,  und  falsch  behandelt,  wenn  sie  sie  in  einer 
Klasse  zurückhielten,  über  die  sie  dem  I,-Niveau  nach  bereits 
hinausgekommen  wären.  So  schreibt  z.  B.  Goddard  jenes  Phä- 
nomen fast  ganz  einer  verfehlten  Versetzungstechnik  auf  Rech- 
nung i). 

Das  heißt  aber  doch,  das  Kind  mit  dem  Bade  ausschütten. 
Freilich  gibt  es  auch  bei  den  Lehrern  menschliche  Irrungen,  und 
nicht  wenige  ihrer  Maßnahmen  mögen  durch  ein  falsches  Urteil 
über  die  geistige  Reife  des  Schülers  bedingt  sein.  Aber  daß  davon 
die  Hälfte  aller  Kinder  betroffen  werden  sollte,  ist  völlig  undenkbar. 

Mir  scheint  vielmehr  gerade  aus  jenem  Ergebnis  hervor- 
zugehen, daß  die  Voraussetzung  der  beiden  bisher  genannten  Stand- 
punkte falsch  ist.  Eine  völlige  Übereinstimmung  von  Schul- 
leistungsfähigkeit und  IP.  ist  gar  nicht  zu  erwarten  und  zu  ver- 
langen, weil  die  Schulleistung  außer  von  der  L  noch  von 
ganz  anderen  Faktoren  abhängt.  So  spielt  ja  die  Stärke  des 
Gedächtnisses,  die  bekanntlich  nur  in  mäßiger  Korrelation  zur  I. 
steht,  beim  Zustandekommen  und  bei  der  Beurteilung  der  Schul- 
leistungen eine  große  —  vielleicht  eine  zu  große  —  Rolle;  auch 
die  verschiedenen  Spezialtalente  kreuzen  die  Wirkung  der  all- 
gemeinen I,  Sodann  aber  kommen  Faktoren  in  Betracht,  die  gar 
nichts  mit  der  intellektuellen  Beschaffenheit  zu  tun  haben,  sondern 
der  Willenssphäre  (in  weitestem  Sinne)  angehören:  die  In- 
tensität und  Ausdauer  der  Aufmerksamkeit,  der  Fleiß  und  die  Ge- 
wissenhaftigkeit, das  Pflichtbewußtsein  und  die  Fähigkeit  der 
Einordnung  in  die  soziale  Gruppe. 

Sie  bilden  vor  allem  den  Einschlag,  der  zur  I.  hinzukommen 
muß,  um  die  bloße  Leistungsmöglichkeit  in  wirkliches  Leisten 
umzusetzen,  und  sie  sind  andererseits  imstande,  auch  da,  wo  die 
I.  geringer  ist,  eine  achtenswerte  Tüchtigkeit  zu  erzeugen.  Das 
gilt  im  Leben,  und  es  gilt  auch  bereits  in  der  Schule;  und  es  ist 
doch  gut,  daß  diese  Verhältnisse  einmal  mit  zahlenmäßiger  Evidenz 
klargelegt  werden  konnten.  Denn  eben  dies  lehren  die  Zahlen,  daß 
die  I.  niemals  mehr  als  ein  Teilfaktor  der  Schultätigkeit  ist;  und 
der  einseitige  Intellektualismus,  der  an  den  Schülern  nur  ihre  Be- 
gabung beachtet  und  wertet,  darf  damit  als  widerlegt  gelten. 
Darum  bleibt  doch  die  eminente  Wichtigkeit  dieses  Faktors  be- 


1)  48,  S.  241  u.  249. 
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stehen,  und  es  wird  seine  genauere  Kenntnis  durch  IP.  und  andere 
psychologische  Hilfsmittel  in  den  Schulen  noch  viel  Nutzen  stiften 
und  Irrungen  und  falsche  Behandlung  rerhindern  können.  Dies 
aber  um  so  mehr,  je  mehr  man  sich  über  Umfang  und  Grenzen 
seiner  Bedeutung  klar  wird.  Wenn  jetzt  z.  B.  in  einem  indivi- 
duellen Fall  gute  Schulleistungen  mit  einem  mittelmäßigen  Aus- 
fall der  IP.  zusammentreffen  und  auch  nicht  ein  Spezialtalent  (das 
ja  leicht  erkennbar  ist)  entscheidenden  Einfluß  gehabt  haben  kann, 
so  ist  eine  an  Sicherheit  grenzende  Wahrscheinlichkeit  vorhanden, 
daß  die  Stärke  dieses  Schülers  vornehmlich  in  Qualitäten  der 
Willens-  und  Charakterseite  zu  suchen  ist. 

So  ist  denn  die  Unstimmigkeit  zwischen  IP.  und  Schul- 
leistungen gerade  geeignet,  unser  Vertrauen  zu  der  psychologischen 
Prüfungsmethode  zu  erhöhen.  Sehr  treffend  bemerkt  hierzu 
Krameri):  ,,Wenn  wir  ....  einen  strikten  Parallelismus  zwischen 
den  Ergebnissen  der  IP.  und  den  Schulleistungen  gefunden  hatten, 
so  müßten  wir  das  größte  Mißtrauen  gegen  die  Methode  haben. 
Es  läge  der  Verdacht  sehr  nahe,  daß  wir  nichts  weiter  tun,  als 
die  Schulkenntnisse  direkt  oder  auf  einem  Umwege  zu  prüfen, 
und  dann  wäre  die  Methode  als  Begabungsprüfung  unbrauchbar 
und  ihre  Anwendung  überflüssig,  da  wir  uns  nur  nach  den  Schul- 
leistungen zu  erkundigen  brauchten." 

e)  Geschlechtsunterschiede.  Experimentalpsychologische 
Vergleichungen  der  geistigen  Leistungsfähigkeiten  von  Knaben 
und  Mädchen  sind  bereits  in  großer  Zahl  ausgeführt  worden,  sie 
arbeiten  aber  fast  sämtlich  mit  Einzeltests  -) ;  die  BS.-Serien  sind 
bisher  nur  in  überraschend  geringem  Maße  für  Zwecke  der  Ge- 
schlechtsvergleichung verwandt  worden  und  haben  auch  noch  nicht 
zu  eindeutigen  Ergebnissen  geführt.  Ich  beschränke  mich  auf  eine 
kurze   Zusammenstellung   des   vorliegenden   Materials. 

Goddard  hat  835  Knaben  und  712  Mädchen  geprüft.    Leider 


1)  54,  S.  30/31.  Bei  K.  bezieht  sich  die  Bemerkung  auf  cUe  Prüfung 
nichtnormaler  Kinder;  sie  gilt  aber  ebenso  für  normale. 

-)  Die  Literatur  ist  zusammengestellt  in  1:  Bibliographie,  Abteilung  VI; 
hier  seien  erwähnt  die  Sammelberichte  über  Testergebnisse  bei  Meyer  und 
VV  res  ebner,  sowie  die  vielseitigen  eigenen  Untersuchungen  von  Cohn  und 
Dieffenbacher  (Nr.  1048,  1072  und  104  der  genannten  Bibliographie). 
Als  ein  bisher  ziemlich  allgemein  bestätigtes  Ergebnis  sei  u.  a.  dies  erwähnt, 
daß  in  der  Ebbinghausschen  Methode  der  Ergänzung  lückenhafter  Texte 
die  Mädchen  den  gleichaltrigen  Knaben  merklich  nachstehen. 
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vvjii't  er  die  Ergebnisse  für  die  verschiedenen  Altersstufen  zu- 
sammen ;  dadurch  verlieren  die  Zahlen  sehr  an  Vergleichbarkeit, 
da  ja  Rückstand  und  Yorsprung  je  nach  der  Altersstufe  ganz  ver- 
schiedenes bedeutet.  Trotzdem  sei  die  Häufigkeitsverteilung  der 
Kinder   (von  mir  in  Prozente   umgerechnet)  wiedergegeben i) : 

Tab.  VIII. 


rückständig 
um  2  und 
mehr  Jhr. 


um  1  Jahr 


auf  dem 
Niveaa 


vorgeschritten 

um  2  und 
mehr  Jhr. 


um  1  Jahr 


Knaben 
Mädchen 


18^ 
181 


2   /O 


23«/o 
17"/o 


20«/o 
230/0 


4»/o 
5«/o 


Hiernach  würde  sich  eine  kleine  Minderwertigkeit  der  Knaben 
herausstellen.  Sie  tritt  besonders  bei  der  Stufe  des  einjährigen 
I. -Rückstandes  hervor,  zu  der  23  0/0  aller  Knaben,  aber  nur  17  0/0 
der  Mädchen  gehören;  die  Mädchen  zeigen  dagegen  einen  etwas 
gi'ößeren  Prozentsatz  von  Niv^eau-  und    vorgeschrittenen  Kindern. 

Die  Behauptung  Goddards,  daß  besonders  die  starken  Rück- 
stände bei  den  Knaben  häufiger  seien,  wird  durch  seine  eigenen 
Zahlen  nicht  bestätigt;  hier  ist  die  Prozentzahl  bei  Knaben  und 
Mädchen  gleich  (181/20/0)2). 

Alle  anderen  Untersucher  welche  die  Geschlechtsunterschiede 
behandeln,  sind  zu  einem  für  die  Knaben  günstigeren  Resultat 
gelangt. 

Besonders  deutlich  sind  die  Ergebnisse,  welche  Bloch  und 
Preiß  an  Volksschulkindern  der  oberschlesischen  Industriestadt 
Kattowitz  g©wonnenhaben(38).  Sie  prüften  7  9  Knaben  und  71  Mädchen 
im  Alter  von  7 — llJahren,  und  zwar  durchweg  solche,  die  mittlere 
Begabung  und  durchschnittliche  Schulleistungen  aufwiesen.  Die 
Prozentsätze  der  richtigen  Lösungen  für  die  einzelnen  Tests  be- 
kunden hier  fast  überall  eine  ganz  bedeutende  Rückständigkeit 
der  Mädchen.  Ich  stellte  alle  Tests,  für  welche  Bloch  und  Preiß 
getrennte  Zahlen  für  Knaben  und  Mädchen  angaben,  zur  Tabelle  IX 
zusammen.   Kein  deutlicher  Geschlechtsunterschied  zeigte  sich  bei  ^^ 

1)  48,  S.  250. 

2)  Man  muß  freilich  bedenken,  daß  es  sich  hierbei  um  Kinder  aus 
den  Normalschulen  handelt;  aber  auch  für  die  schwachsinnigen  Kinder  scheint 
die  Behauptung  nicht  zuzutreffen.  Aus  einer  Tabelle  von  Chotzen  (44,  S.  462) 
berechnete  ich,  daß  die  schweren  Rückstände  um  5  und  mehr  Jahre  vorkamen: 
bei  7  unter  158  schwachsinnigen  Knaben  (=:  4^/.^*'/o),  dagegen  bei  11  unter  122 
Mädchen  {=2^lo). 
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der  Bildbeschreibung  und  bei  der  Definition  abstrakter  Begriffe, 
ein  (nicht  allzu  großer)  Vorsprung  der  Mädchen  bei  den  „schweren" 
Verstandesfragen;  in  allen  übrigen  Proben  zeigen  die  Knaben  viel 
höhere  —  oft  mehr  als  doppelt  so  hohe  —  Prozentsätze  richtiger 
Lösungen.   Man  vergleiche  z.  B.  die  achtjährigen  Kinder:  mehr  als 

Tab.  IX. 


Test 

Alter 

Prozentsatz  der  Kinder, 

welche  den  Test  lösten 

Knaben               Mädchen 

Ol                        1                      0/ 

•    /o              1               /o 

Bildbeschreibung 

kein  Unterschied 

Erinnenmg   an    gelesene    Ge-J 
schichte | 

7  J. 

8  .1. 

9  J. 

I                kein  Unterschied 
80            i              28 
kein  Unterschied 

3  Gewichte  oi"dnen  .... 
5  Gewichte  ordnen  ..,.■{ 

7  J. 

8  J. 

9  J. 

10  J. 

11  J. 

73 
56 
66 
70 

77 

33 
0 
29 
44 
42 

Leichte  Yerstandesf ragen  .     .1 

8  J. 

9  J. 
10  J. 

81                          55 

90                          76 

100            ;            100 

Schwere  Veretandesfragen     . 

9  J. 

10  J. 

11  J. 

25            i              41 
70            1              80 
70                          80 

Definition  abstrakter  Begr.     . 

kein  Unterschied 

3  "Worte  zu  einem  Satz  kom-| 
binieren 

9  .T. 

10  J. 

11  J. 

70 

82 

100 

38 

40 

100 

verstellte  Worte  eines  Satzes 
ordnen     

11  J. 

70                          33 

60  "Worte  in  3  Min.  nennen 

76                          50 

Kritik  absui"der  Sätze    .     .     . 

11  J. 

77 

40 

Vergleichung  v.  Gegenständen  f 
aus  dem  Gedächtnis  .     .     .\i 

7  J. 

8  J. 

60 
80 

50 
55 

die  Hälfte  dieser  Knaben,  dagegen  kein  einziges  Mädchen,  konnte 
fünf  Gewichte  richtig  ordnen;  vier  Fünftel  aller  achtjährigen 
Knaben  gaben  Gelesenes  aus  der  Erinnerung  richtig  wieder,  lösten 
die  leichten  Verstandesfragen  und-  die  Vergleichung  von  Gegen- 
ständen aus  dem  Gedächtnis,  während  die  entsprechenden  Lei- 
stungen den  achtjährigen  Mädchen  nur  zu  28 o/o,  55 o/o,  55 o/o  ge- 
langen.   Wo  ein  Test  durch  mehrere  Jahrgänge  verfolgt  wird,  ist 
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der  Geschlechtsunterschied  bei  den  jüngeren  Kindern  fast  stets 
größer  als  bei  den  älteren.  Dies  entspricht  wieder  dem  psycholo- 
gischen Gesetz,  daß  die  psychischen  Differenzierungen  bei  schwe- 
reren  Leistungen  viel  deutlicher  hervortreten  als  bei  leichteren. 

Bloch  und  Preiß  weisen  selbst  darauf  hin,  daß  die  ihren 
Ergebnissen  zugrunde  liegende  Personenzahl  zu  klein  ist,  um  schon 
feststehende  Schlüsse  zu  gestatten.  Bemerkenswert  ist  es  jeden- 
falls, daß  sich  die  Eückständigkeit  der  Mädchen  auf  eine  so  große 
Zahl  verschiedenartiger  Proben  erstreckt. 

Bobertagi)  verglich  für  jede  Altersstufe  gleichviel  Mädchen 
und  Knaben,  die  ihren  Schulleistungen  nach  durchschnittlich 
waren;  das  lA.  der  Knaben  zeigte  jedesmal  einen  kleinen  Vor- 
sprung, der  bei  den  8-,  9-  und  12  jährigen  1/7,  bei  den  10-  und 
11  jährigen  1/5  einer  Jahresstufe  betrug. 

An  einer  sehr  kleinen  Personenzahl  hat  Mlle.  Descoeudres-) 
Vergleichungen  angestellt,  indem  sie  aus  sechs  Jahrgängen  je  einen 
intelligenten  und  einen  unintelligenten  Knaben  und  entsprechend 
zwei  Mädchen  auswählte.  Von  sämtlichen  guten  Einzelantworten 
fielen  auf  die  Knaben  52  0/0,  auf  die  Mädchen  48  0/0,  es  besteht  also 
auch  hier  ein  —  freilich  unbedeutender  —  Vorsprung  der  Knaben. 

f)  Wiederholte  Prüfungen  derselben  Kinder.  Aus  der 
soeben  erscheinenden  Publikation  Bober  tags  (40  II)  muß  hier 
noch  eine  wichtige  Versuchsreihe  erwähnt  werden,  die  sich  grund- 
sätzlich von  allen  bisher  angestellten  unterscheidet.  Er  unterzog 
nämlich  eine  große  Anzahl  der  von  ihm  im  Jahre  1909  geprüften 
Kinder  (im  ganzen  83)  im  folgenden  Jahre  einer  erneuten  Prüfung. 
Die  Anwendung  derselben  Tests  scheint  keine  merkliche  Stönmg 
bewirkt  zu  haben,  da  die  Erinnerung  an  Einzelheiten  der  vor- 
jährigen Prüfung  so  gut  wie  ganz  verschwunden  war.  Auf  drei 
Probleme  werfen  mm  diese  Untersuchungen  Licht. 

Erstens  zeigen  sie  die  Zuverlässigkeit  der  Testmethode  in 
im  erwartet  günstigem  Licht.  Bobertag  ordnete  die  83  Kinder 
nach  der  Anzahl  der  von  ilmen  geleisteten  Tests  in  Rangreihen ; 
und  es  zeigle  sich,  daß  die  Rangordnungen  aus  den  beiden  Jahren 
nahezu  übereinstimmten.  Die  Korrelation  zwischen  ihnen  betrug 
0,95.  Mag  also  selbst  die  absolute  Graduierung  durch  die  BS.- 
Tests  nach  I. -Altersstufen   noch  unsicher  sein   —  für  die   rela- 


')  40,  U,  S.  503 '4. 
2)  46. 
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tive  Graduierung  erweisen  sie  sich  als  sehr  sicher.  Der  Platz, 
den  ein  Kind  auf  Grund  einer  einmaligen  IP.  innerhalb  einer 
Gruppe  erhält,  darf  in  hohem  Maße  als  zuverlässig  gelten. 

Zweitens  ergab  sich  eine  deutliche  Beziehung  zwischen  dem 
I. -Zustand  eines  Kindes  und  dem  Tempo  seiner  weiteren  I. -Ent- 
wicklung. Diejenigen  Kinder,  welche  bei  der  ersten  Prüfung  auf 
dem  normalen  I. -Niveau  standen,  waren  ein  Jahr  später  durch- 
schnittlich genau  um  eine  Jahresstufe  weiter  gekommen;  dagegen 
hatten  die  rückständigen  Kinder  in  der  gleichen  Zeit  nur  um  '^j^, 
die  Kinder  mit  I.-Yorsprung  dagegen  um  ^/^  einer  Jahresstufe  an 
I.  zugenommen. 

Drittens  fand  Bobertag,  daß  die  Zahl  derjenigen  Kinder, 
welche  von  dem  Niveau  üires  Alters  nach  oben  oder  unten  ab- 
wichen, mit  steigendem  Alter  zunahm.  Daraus  ergibt  sich,  daß 
die  Jahresstufe  als  Maß  der  Abweichung  bei  höherem  Alter  immer 
weniger  bedeutet:  Eine  I.,  die  in  jüngeren  Jahren  noch  nicht 
um  ein  ganzes  Jahr  nach  oben  oder  unten  vom  Niveau  differiert, 
überschreitet  in  höheren  Jahren  diese  nun  kleiner  gewordene 
Stufe.  Das  gleiche  Ergebnis  ist,  wie  sich  im  nächsten  Abschnitt 
zeigen  wird,  schon  früher  bei  abnormen  Kindern  festgestellt 
worden. 

4.  Nichtnormale  Kinder. 

a)  L-Stillstand  und  I.-Rückstand.  Der  Intelligenz- 
quotient. Als  Bin  et  sein  Testsystem  erdachte,  hatte  er  in  erster 
Linie  die  Prüfung  nichtnormaler  Kinder  im  Auge,  damit  solche 
rechtzeitig  erkannt  und  den  Hilfsklassen  und  Schwachsinnigen- 
anstalten  überwiesen  werden  könnten.  B.  hat  auch  mit  Simon  an 
einer  größeren  Zahl  solcher  Kinder  seine  Methode  erprobt,  aber  leider 
keine  ausführlichere  Darstellung  dieser  Untersuchung  gegeben; 
Avohl  aber  zieht  er  Folgerungen  aus  seinen  Versuchen,  welche  die 
Beziehung  des  Schwachsinns  zu  seiner  Methode  auf  überaus  ein- 
fache Formeln  bringen.  Die  eine  These  betrifft  den  I.-Rückstand 
und  lautet  1) :  „Ich  meinerseits  bin  der  Ansicht,  daß  jeder  zwei- 
jährige I.-Rückstand  auf  ein  Zurückgebliebensein  schwerer  Art 
schließen  läßt."  Die  andere  bezieht  sich  auf  den  I.-Stillstand  und 
besagt,  daß  Imbezille  nicht  das  lA.  von  sieben  Jahren.  Debile 
nicht  das  von  neun  Jahren  überschreiten. 

Auch  die  zweite  Untersuchung  an  schwachsinnigen  Kindern 

1)  37,  S.  113. 
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krankt  daran,  daß  genauere  Daten  fehlen.  Goddard  hat  die  jugend- 
lichen und  erwachsenen  Insassen  seiner  Anstalt  für  Schwachsinnige 
in  Vineland  N.  J.,  fast  400  Personen,  nach  BS.  1908  geprüft  (47); 
er  gibt  aber  nur  an,  wie  oft  die  einzelnen  Stufen  des  JA.  vertreten 
waren,  unterläßt  jedoch  die  Bezugnahme  auf  das  Lebensalter,  so 
daß  der  Grad  der  Rückständigkeit  in  keiner  Weise  aus  seinen 
Tabellen  hervorgeht.  Seine  Zahlen  lassen  daher  nur  wenige,  später 
zu  erwähnende  Schlüsse  zu. 

So  sind  bisher  die  einzigen  gründlichen  Untersuchungen,  die 
an  größeren  Zahlen  nichtnornialer  Kinder  unternommen  sind,  die 
Breslauer  Prüfungen  der  Psychiater  Kramer  (54)  und  Chotzen 
(gemeinsam  mit  Nicolauer  [43,  44]).  Und  zwar  ergänzen  sich  die 
beiden  Forscher  in  erfreulicher  Weise  dadurch,  daß  verschiedenartige 
Kategorien  von  Kindern  geprüft  wurden.  Kr  am  er  s  Material  be- 
stand nämlich  zum  Teil  aus  Jugendlichen,  die  vor  das  Jugend- 
gericht gekommen  und  von  diesem  der  psychiatrischen  Begut- 
achtung überwiesen  worden  waren,  zum  andern  Teil  aus  solchen 
Kindern,  welche  wegen  psychischer  oder  wegen  nervöser  Erkran- 
kung die  Klinik  oder  Poliklinik  aufsuchten.  Chotzen  wandte 
die  Methode  als  städtischer  Hilfsschularzt  an;  er  prüfte  damit 
alle  Kinder,  welche  neu  der  Hilfsschule  überwiesen  waren. 
Während  es  Kr  am  er  mehr  mit  höheren  Jahrgängen  zu  tun  hatte, 
brachte  es  die  Natur  der  Aufgabe  Chotzens  mit  sich,  daß  seine 
meisten  Prüflinge  im  Alter  von  acht  und  neun  Jahren  standen, 
doch  erweiterte  er  seine  Untersuchung  durch  Hinzunahme  auch 
älterer  Hilfsschüler.  Die  Technik  richtete  sich  genau  nach  dem 
Vorbild  Bob  er  tags,  wie  ja  auch  dieser  selbst  außer  den  normalen 
Kindern  eine  Reihe  abnormer  geprüft  hatte. 

Über  die  Brauchbarkeit  der  Methode  zu  solchen  Zwecken 
äußern  sich  beide  sehr  günstig.    So  schreibt  Kramer: 

„Als  Gresamtergebnis  möchte  ich  zunächst  hervorheben,  daß  wir  mit 
der  Methode  für  unsere  Zwecke  recht  zufrieden  waren.  Ganz  abgesehen 
von  den  zahlenmäßigen  Resultaten  lernt  man  im  Laufe  der  Prüfung  infolge 
ihrer  Vielseitigkeit  das  Kind  in  seiner  Eigenart,  in  seinem  Verhalten  auf 
Anforderungen  verschiedener  Art  in  ausgezeichneter  Weise  kennen,  und  er- 
hält für  die  qualitativ  abweichende  Reaktionsweise  des  Schwachsinnigen  gute 
Anhaltspunkte.  Bei  den  von  der  Zentrale  für  Jugendfürsorge  gesandten  Kin- 
dern, die  meist  nur  zu  einer  einmaligen  Untersuchung  zu  bekommen  waren, 
machte  sich  die  relativ  kurze  Zeitdauer  der  Prüfung  (zirka  3/4  bis  1  Stunde), 
in  der  man  zu  einem  verwertbaren  Urteil  über  die  Intelligenz  gelangt,  äußerst 
angenehm  geltend.  In  allen  den  Fällen,  in  denen  auf  Grund  anamnestischer 
Daten  oder  auf  Grund  klinischer  Beobachtungen  sich  sonst  ein  Urteil  über  die 
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Intelligenz  gewinnen  ließ,  haben  sich  Widersprüche  zu  dem  Ergebnisse  der 
Binetprüfung  niit  ganz  geringen  Ausnahmen  nicht  ergeben i)." 

Nun  zu  den  Zahlenwerten : 

Um  mit  der  zweiten  der  oben  genannten  These  Binets  zu 
beginnen,  so  hat  seine  Behauptung  eines  ,.1. -Stillstandes"  auch 
anderweitige  Bestätigung  gefunden.  Es  soll  dies  heißen:  für 
jeden  Schwachsinnigen  gibt  es  eine  Staffel,  die  einmal 
erreicht,  einen  definitiven  Endpunkt  für  die^  Prüfungs- 
leistuugen  bedeutet;  auch  das  steigende  Lebensalter  ändert 
nichts  mehr  daran. 

Goddard  fand,  daß  die  Insassen  seiner  Anstalt  sich  dem  lA. 
nach  ziemlich  gleichmäßig,  mit  ungefähr  je  10 — 11  o/o,  auf  die 
Staffeln  von  1 — 9  Jahr  verteilten,  daß  dagegen  die  Staffeln  10 — 12 
zusammen  nur  mit  7  o/o  vorkamen.  Wenn  er  auch  hierbei  be- 
dauerlicherweise diejenigen  Kinder,  die  ihrer  Jugend  wegen  viel- 
leicht noch  über  ihre  augenblickliche  Staffel  hinauskommen 
konnten,  und  die  anderen  Insassen,  bei  denen  jede  Entwicklung 
schon  längst  stagnierte,  zusammenwarf,  so  bleibt  doch  bestehen, 
daß  Schwachsinnige  das  lA.  9  nur  ganz  ausnahmsweise  über- 
schreiten. 

Durch  Vergleiche   dieser  lA.   mit  den  ärztlichen  Diagnosen 

kommt  er  zu  folgender  Aufstellung: 

stark      mittel      schwach 
Es  erreichen  die:      Idioten  ImbezUlen  „morons" 

das  lA.  von  1  ¥        ^3  T        ^5  ^T       8  9  10  11  12 

Die  „morons"  decken  sich  wohl  mit  unseren  Debilen;  die 
obige  Statistik  ergab,  daß  diese  Debilen  zum  weitaus  größten  Teil 
ein  lA.  von  8  und  9  Jahren  hatten. 

Kramer2)  und  Chotzen^)  kamen  zu  ähnlichen  Ergebnissen. 

Goddard  verglich  das  experimentell  gefundene  lA.  mit  dem 
Gesamteindruck,  welchen  die  Zöglinge  auf  die  Lehrer  und  das 
Personal  der  Anstalt  machten  und  fand  die  Übereinstimmung  sehr 
befriedigend;  die  Kinder  eines  bestimmten  lA.  bildeten  eine  in 
sich  ziemlich  homogene  Gruppe,  auch  in  bezug  auf  ihre  Alltags- 
verrichtungen und  ihre  Fähigkeit,  sich  den  Bedingungen  des  An- 
staltslebens anzupassen;  ergibt  daraufhin  eine  Schilderung,  w^elche 
Erwartungen  man  an  das  praktische  Verhalten  eines  Kindes  von 


1)  54,  S.  27. 
•-)  54,  S.  29. 
»)    44.  S.  494. 
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gegebenem  lA.  knüpfen  kann.    All  diese  Aufstellungen  bedürfen 
aber  wohl  noch  sehr  der  Nachprüfung. 

Vor  einer  falschen  Auffassung  des  Begriffes  „Stillstand"  möge 
noch  ausdrücklich  gewarnt  werden.  Ein  Imbeziller,  der  Zeit  seines 
Lebens  nicht  über  das  „lA.  7"  hinauskommt,  ist  darum  nicht  ein- 
fach einem  siebenjährigen  Xinde  gleichzusetzen ;  er  wächst  in  vielen 
Punkten  über  jenen  Status  hinaus,  er  sammelt  Erfahrungen,  die 
ein  normales  siebenjähriges  Kind  nicht  hat,  erlernt  manche  Fertig- 
keiten, erlebt  in  sich  das  Erwachen  von  Trieben  und  Bedürfnissen, 
die  eben  das  höhere  Alter  mit  sich  bringt.  Der  Stillstand  bezieht 
sich  also  nur  auf  jene  Gruppe  spezifischer  I.-Leistungen,  die  in 
den  Tests  geprüft  werden.  Auch  von  diesen  mag  noch  die  eine  oder 
andere  eine  Entwicklung  zeigen  (vgl.  dazu  S.  59),  aber  es  bleiben 
doch  so  viele  endgültige  Defekte  übrig,  daß  im  Gesamtergebnis 
das  Erreichen  eines  höheren  Wertes  als  lA.  7  unmöglich  wird. 

Wichtig  ist  noch  der  Befund,  den  Goddard  bezüglich  des  lA. 
einer  besonderen  Gruppe,  nämlich  der  moralisch  Schwach- 
sinnigen machte;  es  zeigte  sich,  daß  diese  sich  lediglich  aus  den 
höchsten  in  der  Anstalt  vorkommenden  Intelligenzaltern  rekru- 
tierte. Die  22  Individuen  verteilten  sich  auf  die  lA.  9,  10,  11,  12 
mit  den  Häufigkeiten  15,  5,  1,  1.  G.  erklärt  diese  Tatsache,  daß  die 
moralischen  Defekte  nicht  unter  lA.  9  hinabreichen,  folgender- 
maßen :  Gewisse  unmoralische  Instinkte,  wie  Trieb  zum  Lügen,  zum 
Stehlen  usw.  erwachen  normalerweise  um  das  neunte  Jahr  herum ; 
später  entwickelt  sich  die  Vernunft,  welche  die  Hemmung  diesen 
Instinkten  gegenüber  liefert.  Bei  Kindern  unter  dem  lA.  9  sind 
jene  Instinkte  noch  nicht  entwickelt,  die  Kinder  aber,  die  ungefähr 
auf  lA.  9  stehenbleiben,  zeigen  jene  Instinkte,  ohne  bis  zu  der 
Entwicklung  der  Hemmung  zu  gelangen  und  werden  so  moralisch 
defekt. 

Man  mag  die  Richtigkeit  dieser  Erklärung  dahingestellt  sein 
lassen,  jedenfalls  ergibt  sich  doch,  daß  starker  moralischer 
Rückstand  nicht  mit  gleich  starkem  intellektuellen 
Defekt  verbunden  ist.  Der  sittliche  Defekt  hat  also  eine  Exi- 
stenz von  gewisser  Selbständigkeit,  und  insofern  ist  die  alte  Be- 
zeichnung „moral  insanity"  doch  nicht  ganz  unrichtig  gewesen. 

Gleichzeitig  sei  auch  auf  ganz  ähnliche  Befunde  Kr  am  er  s 
verwiesen,  dem  ja  unter  seinen  kriminellen  Prüflingen  mehrfach 
der  Typ  begegnen  mußte.  Er  sagt:  „Es  handelt  sich  hier  um 
Individuen,  die  in  das  Gebiet  der  moralischen  Defektzustände  ge- 

4* 
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hören,  bei  denen  schon  von  früher  Jugend  an  sich  ein  auffallender 
Mangel  an  ethischen  Vorstellungen,  an  altruistischen  Regungen 
bemerkbar  macht.  Für  die  Frage,  inwieweit  diese  moralischen 
Defekte  unabhängig  von  intellektuellem  Zurückbleiben  vorkommen, 
ist  es  bemerkenswert,  daß  eine  Anzahl  dieser  Kinder  bei  der  Prü- 
fung ein  dem  Alter  entsprechendes  Resultat  ergab.  Auch  bestand 
in  den  Fällen,  wo  auch  die  intellektuellen  Leistungen  hinter  der 
Norm  zurückbleiben,  keineswegs  ein  Parallelismus  beider  Artend)." 

Damit  sind  wir  schon  aus  der  Betrachtung  des  I:-Stillstandes 
herausgetreten  in  die  Erörterung  über  den  I. -Rückstand  der 
Schwachsinnigen.  Binet  sieht  das  Maß  des  Rückstandes  ein- 
fach in  der  Differenz  zwischen  lA.  und  LA.  und  ist  von  der  all- 
gemeinen Brauchbarkeit  dieses  Maßes  so  überzeugt,  daß  er  den 
Wert  „2  Jahre"  generell  als  Ausdruck  einer  bestimmten,  und  zwar 
schweren  Rückständigkeit  betrachtet. 

Auch  die  Nachfolger  Binet s  bedienten  sich  noch  dieses 
Maßes,  aber  gerade  ihre  Ergebnisse  lehren,  daß  wir  uns 
nicht  mit  ilim  zufrieden  geben  können.  Es  zeigte  sich  nämlich, 
daß  eine  und  dieselbe  Differenz  —  also  z.  B.  ein  IR.  von 
3  Jahren  —  bei  verschiedenen  Lebensaltern  sehr  Verschie- 
denes bedeutet.  So  sagt  Kramer  (54):  „Es  darf  nicht  ge- 
schlossen werden,  daß  etwa  ein  12  jähriges  Kind  mit  dem  LI.  9  in 
gleichem  Grade  schwachsinnig  ist,  wie  ein  8  jähriges  Kind  2)  mit 
dem  lA.  5  .  .  .  Bei  den  uns  von  der  Jugendfürsorgezentrale  über- 
wiesenen Kindern  .  .  .  zeigte  es  sich  deutlich,  daß  bei  den  jüngeren 
Kindern  meist  nui^  geringe,  in  den  höheren  Altersstufen  immer 
größere  Differenzen  sich  ergaben,  während  die  Defektzustände, 
soweit  wir-  aus  den  sonstigen  Kriterien  ein  Urteil  darüber  haben, 
durchaus  keinen  entsprechenden  Unterschied  zeigten,  sondern  im 
Durchschnitt  etwa  gleich  zu  sein  schienen."  Ähnlich  konstatiert 
Chotzen^):  „Infolge  einer  Entwicklungshemmung  bleibt  bei 
schwachsinnigen  Kindern  das  lA.  immer  mehr  hinter  üirem  LA. 

1)  54,  S.  28.  In  diesem  Zusammenhange  sei  auch  auf  die  Befunde, 
welche  Frau  Dosai-Revesz  mit  Einzeltests  erzielte,  hingewiesen  (4).  Sie 
verglich  die  Rechen-,  Gedächtnis-  und  Aussageleistungen  von  normalen 
Kindern,  Einfach-Schwachsinnigen  und  Moralisch-Schwachsinnigen  und  fand, 
daß  die  Ergebnisse  der  letzten  Gruppe  fast  durchweg  eine  Mittelstellung 
zwischen  den  beiden  anderen  Gruppen  einnahmen. 

-)  S.  29.  Im  Text  findet  sich  hier  ein  Druckfehler;  es  steht  dort 
siebenjährig  statt  achtjährig. 

^)    44,  S.  493. 


Die  psychologischen  Methoden  der  Intelligenzprüfung.  53 

zurück.  Je  jünger  sie  sind,  desto  mehr  hat  ein  Defekt,  in  Jahres- 
graden gemessen,  zu  sagen;  je  älter,  um  so  weniger  bedeutet  ein 
Jahr  in  der  Entwicklung." 

Wie  groQ  hier  die  Schwankungen  sind,  möge  eine  Aufstellung 
zeigen,  die  ich  aus  einer  Chotzenschen  Tabelle i)  abgeleitet  habe. 
Ch.  hat  alle  Hilfsschüler  —  unabhängig  von  den  Tests  —  auch 
nach  den  üblichen  medizinisch-psychiatrischen  Gesichtspunkten 
untersucht  und  sie  danach  einer  der  bekannten  Schwachsinns- 
gruppen (debil,  imbezill,  idiotisch)  zugewiesen;  außerdem  mui3te 
er  einige  als  nicht-schwachsinnig  und  einige  als  debil-fraglich 
bezeichnen.  Man  darf  doch  nun  annehmen,  daß  die  Angehörigen 
einer  Gruppe,  z.  B.  die  Debilen,  unabhängig  vom  Lebensalter 
wenigstens  ungefähr  gleichwertig  in  iliren  I. -Anlagen  sein  müßten. 
Tab.  X  ergibt  nun  aber,  daß  der  I.-Rückstand,  als  Differenz  be- 
rechnet, ganz  andere  Werte  bei  den  älteren  als  bei  den  jüngeren 
zeigt.  Und  Tab.  XI,  in  der  für  jede  Altersstufe  die  Durch- 
schnittswerte dieser  Rückstandsmaße  gezogen  sind,  zeigt  ein 
rapides  Ansteigen ;  so  sind  die  zwölfjährigen  Imbezillen  um  doppelt 
soviel  Jahre  rückständig  als  die  achtjährigen  Imbezillen  (4,7  Jahre 
gegen  2,3  Jahre). 

Daraus  scheint  mir  zu  folgen,  daß  der  Differenzwert  nur  dann 
lanwendbar  ist,  wenn  man  es  lediglich  mit  Kindern  einer  be- 
stimmten Altersstufe  zu  tun  hat.  Sollte  es  z.  B.  einmal  eingeführt 
werden,  daß  alle  Sechsjährigen  beim  Eintritt  in  die  Schule  einer 
IP.  unterzogen  werden,  so  haben  die  Bezeichnungen:  „um  ein 
Jahr  rückständig",  ,,um  ein  Jahr  voraus"  eindeutigen  Sinn. 

Anders,  wenn  Kinder  sehr  verschiedenen  Lebensalters  in  Be- 
tracht kommen,  oder  wenn  man  die  Größe  des  Rückstandes  all- 
gemein ausdrücken  will.  Der  Differenzwert  allein  kann  dann  sehr 
Verschiedenes  bedeuten,  und  es  müßte  mindestens  immer  noch 
das  LA.  hinzugefügt  werden,  damit  man  daraus  die  Tragweite  der 
Differenz  ermessen  kann.  Zu  wie  umständlichen  Formulierungen 
dies  zwingt,  zeigt  z.  B.  der  Satz  von  Chotzen:  ,,Bei  Kindern  von 
8 — 9  Jahren  kann  ein  Defekt  von  1  Jahre,  bei  10 — 12jährigen 
ein  solcher  von  2  Jahren  vorliegen,  ohne  daß  Schwachsinn  be- 
steht; dagegen  haben  die  Kinder  der  betreffenden  Altersstufen  mit 
Rückständigkeit  von  2  bzw.  3  Jahren  sicher  keine  normale  I. 
mehr."    (S.  493/4.) 

1)  S.  485. 
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Tabelle  X. 

Häufisrkeit  der  IE.  bei  verschiedenen  Schwachsinnsformen  und  Lebensaltem. 


Xicht-Schwachsinnige 

fraglich 

DebUe 

Int.-Eückst. 

OJ.       IJ.       2J.       3J. 

IJ. 

2  J. 

3J. 

4J. 

r  8 

6           11 

_  !  _ 

13 

4 

_ 

_ 

9 
10 
11 
19 

— 

7 

0            — 
9 

1 

3 
3 

— 

— 

Lebens- 

< 

alter 

— 

— 

1 

1 

j      — 

-  1 

1 

1 

13 

— 

—        ;        — 

— 

— 

— 

1 

1 

Int.-Eückst.      1  J. 


DebUe 
2  J.   I   3  J. 


4  J.  :i  1  J. 


Imbezille 
2  J.   I   3  J.   !   4  J. 


5  J. 


r  8 

4 

10 

2 

_ 

6 

21 

9 

2 

1 

Lebens- 

9 
10 

— 

1? 

0 

2 

7 

— 

1    — 

8 

30 
7 

8 
5 

2 
4 

alter 

11 



5 

1 





2 

[l2 

— 

— 

2 

1 

— 

— 

— 

1 

2 

Tab.  XI. 
Durchschnittlicher  Eückstand  in  Jahresgraden. 


Nicht- 
Schwachs. 

Deb.? 

Deb. 

Imb. 

f   8 

0,65 

1,3 

1,9 

2.3 

9 

1.4 

1,7 

2,1 

3,1 

Lebensalter     .    .  < 

10 
11 

2 

3 

2 
3,5 

2.6 
3,2 

3,8 
4 

12 

2 

3 

3,3 

4,7 

il3 

3,5 

Tab.  Xn. 
DurcLschnittlicbe  Intelligenz-Quotienten. 


Mcht- 

Sch  wachs. 

Deb.? 

Dpb. 

Imb. 

r  8 

0.92         1 

0.84 

0,76 

0,71 

9 

0,85 

0,81 

0,77 

0.67 

10 

(0,80) 

(0.80) 

0,74 

0,62 

11 

,        (0,73) 

(0.68) 

0,71 

(0,64) 

12 

1        (0,75)       j 

(0,75) 

(0,73) 

(0,61) 

[13 

1                        1 

(0,73) 

Das  Wachsen  der  Differenz  mit  wachsendem  Alter  bei 
gleichem  Sch'^-achsinnsgrade  ist  psychologisch  durchaus  verständ- 
lich. Denn  da  der  Schwachsinn  hauptsächlich  in  einem  Zurück- 
bleiben der  Entwicklung  hinter  der  normalen  besteht,  so  wird 
auch  das  Entwicklungstempo  ein  verlangsamtes  sein;  imd  jedes 
weitere   Lebensjahr   muß    daher    die   Differenz   vergrößern,    zum 
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mindesten  so  lange,  als  man  von  einer  Entwicklung  der  I.  über- 
haupt sprechen  kann.  Diese  Betrachtung  legt  nun  den  Gedanken 
nahe,  den  Eückstand  statt  durch  die  absolute  Differenz  durch  die 
relative,  d.  h.  durch  ihr  Verhältnis  zum  Lebensalter  zu  messen. 
Einen  derartigen  Gedanken  hatte  bereits  Bober  tag  ins  Auge  ge- 
faßt; bei  Kramer  findet  sich  dann  eine  Hindeutung  freilich  mit 
großem  Vorbehalt  i)  (5):  „Ob  sich  etwa  ein  bestimmter  Rechnungs- 
modus, bei  welchem  die  Jahresdifferenz  zum  Lebensalter  in  Be- 
ziehung zu  setzen  wäre,  und  der  uns  dann  für  den  Schwachsinns- 
grad einen  absoluten  Maßstab  gibt,  festsetzen  lassen  wird,  erscheint 
mir  zweifelhaft" 

Die  nun  vorliegenden  Ergebnisse  Chotzens  erlauben,  die 
Brauchbarkeit  eines  solchen  relativen  Maßes  nachzuprüfen.  Ich 
möchte  empfehlen,  nicht  die  Differenz,  sondern  das  Li.  selbst  zum 
Lebensalter  ins  Verhältnis  zu  setzen,  und  so  den  schon  erwähnten 
Intelligenzquotienten  zu  gewiimen,  der  angibt,  welchen 
Bruchteil  der  für  sein  Alter  normalen  I.  ein  Schwach- 
sinniger besitzt:  IQ.  =  -^^  '-   Ein  achtjähriges  Kind  mit  dem  lA.  6 

LA. 

hat  also  einen  IQ.  = -q- =  0,75 ;  derselbe  IQ.  kommt  einem  zwölf- 
es 

jährigen  Kind  mit  dem  lA.  9  zu. 

Verwandeln  wir  jetzt  die  Werte  der  aus  Chotzen  berechneten 
TabeUe  XI  in  Quotienten,  so  erhalten  wir  die  Tabelle  XII.  Die 
Idioten  sind  aus  später  zu  besprechenden  Gründen  fortgelassen. 
Diejenigen  Zahlen,  die  wegen  zu  geringer  Personenzahl  nicht  als 
eigentliche  Durchschnittswerte  gelten  können,  sind  eingeklammert. 
Die  Tabelle  zeigt  nun  für  jede  die  beiden  Hauptschwachsinns- 
formen  zwar  nicht  konstante,  aber  doch  sehr  ähnliche  IQ.  durch 
mehrere  Lebensjahre  hindurch.  Insbesondere  sind  die  Debilen 
überraschend  gleichförmig;  variiert  doch  ihr  Durchschnitts- 
quotient durch  alle  fünf  Jahrgänge  von  8 — 12  nur  innerhalb  des 
engen  Gebietes  von  0,71 — 0,77;  ihre  I.  ist  also,  an  der  normalen 
gemessen,  grob  ausgedi'ückt,  eine  „Dreiviertels-Intelligenz".  Die 
Imbezillen  weisen  etwas  größere  Schwankungen  auf ;  doch  stimmen 
die  IQ.  wenigstens  für  die  Altersstufen  9 — 11  recht  gut  über- 
ein; sie  verleihen,  wiederum,  grob  gesprochen,  ihren  Inhabern 
eine  knappe  ,,Zweidrittels-Intelligenz". 

1)  54,  S.  30. 
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Die  beiden  bei  Chotzen  zuerst  genannten  Gruppen  sind  so 
spärlich  vertreten,  daß  die  Durchschnittswerte  höchstens  für  die 
niederen  Jahrgänge  beachtet  werden  dürfen;  und  hier  stimmt  der 
IQ.  trefflich  mit  der  medizinischen  Diagnose  überein.  Die  „Nicht- 
schwachsinnigen" haben  einen  IQ.  nahe  an  0,9  und  die  Fraglich- 
Debilen  bilden  mit  ihrem  IQ.  zwischen  0,80  und  0,84  eine  tat- 
sächliche Zwischenstufe  zwischen  den  Nichtschwachsinnigen  und 
den  eigentlich  Debilen.  —  Die  vereinzelten  Fälle  älterer  Kinder 
(im  ganzen  7),  die  Chotzen  diesen  beiden  Gruppen  zuteilte,  wür- 
den ihrem  IQ.  nach  zum  größten  Teil  den  Debilen  zuzurechnen 
sein.  Vielleicht  kann  in  solchen  Fällen  der  IQ.  die  schwankende 
medizinische  Diagnose  unterstützen. 

Da  den  obigen  Quotientenlisten  der  Torwurf  gemacht  werden 
könnte,  daß  sie  nur  Durchschnittswerte  enthalten,  und  daß  diese 
zum  Teil  auf  zu  geringen  Anzahlen  von  Einzelwerten  aufgebaut 
sind,  habe  ich  noch  eine  Berechnung  aufgestellt,  in  der  die  IQ. 
der  einzelnen  Kinder  festgestellt  und  in  ihrer  Häufigkeits- 
verteilung registriert  wurden.  Hierbei  wurde  vom  Lebensalter  ab- 
gesehen. Es  wurden  bei  der  Zählung  immer  die  Werte  innerhalb 
eines  Zehners  zusammengefaßt,  also  die  IQ.  zwischen  0,91  und 
1,00,  zwischen  0,81  und  0,90  usw. 

Tabelle  XIII  enthält  die  so  gewonnene  Verteilung  für  jede 
Schwachsinnsgruppe,  in  absoluten  und  in  Prozentzahlen;  Figur  1 
zeigt  zugleich  eine  graphische  Darstellung  der  prozentuellen 
Häufigkeiten. 

Tab.  Xm. 
Häufigkeiten  der  IQ.  in  den  verschiedenen  Schwachsinnsgnippen. 


DJcht-schwacbs. 

deb.? 

debil 

imbez. 

IQ. 

Häufigkeit 

Häufigkeit 

Häufigkeit 

Häufigkeit 

abs.   1     0/^ 

abs.    1     0/^ 

abs.    1     0/^ 

abs.    1     0/^ 

von  0.91  —  1,00 

6         18 

„    0.81-0.90 

19         57 

14 

48 

5 

9 

6           5V, 

„    0,71—0.80 

8         25 

3 

45 

37 

67 

30 

27 

„    0.61—0.70 

2 

7 

13 

24 

49 

44 

„    0.51—0,60 

1 

15 

13V. 

„    0,41—0.50 

1 

9 

8 

..     0,31—0,40 

2 

2 

Ins^resamt 


33       100 


29       100 


55        100 


111 


100 


Es    ergibt    sich    eine    deutliche    Scheidung    der   Häufigkeits- 
maxima   für   die   Hauptgruppen,    und   zwar  haben    —   ganz   ent- 
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sprechend  unserem  frühereu  Ergebnis  —  die  Nichtschwachsinnigen 
am  häufigsten  IQ.  zwischen  0,81  und  0,90,  die  Debilen  zwischen 
0,71  und  0,80,  die  Imbezillen  zwischen  0,61  und  0,70.  Bei  den 
Imbezillen  ist  die  Streuung  der  IQ.  gi'ößer  als  bei  den  anderen 
Gruppen,  wie  die  Durchschnittswerte  auch  schon  gezeigt  hatten. 
Bemerkenswert  ist  die  ziemlich  symmetrische  Form  der  drei  Kur- 
ven; sie  bewirkt,  daß  sich  Häufigkeitsmaximum  und  Durchschnitts- 
wert einigermaßen  decken. 
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Der  Übergangscharakter  der  Gruppe  „deb?"  kommt  ebenfalls 
zum  typischen  Ausdruck :  ihre  Angehörigen  verteilen  sich  ziemlich 
gleichmäßig  auf  die  Gebiete,  die  einerseits  für  die  Nichtschwach- 
sinnigen, andererseits  für  die  ausgesprochen  Debilen  die  charak- 
teristischsten sind. 

Die  Zahl  der  von  Chotzen  geprüften  Kinder  ist  noch  nicht 
groß  genug,  und  vor  allem  ihre  Verteilung  auf  die  verschiedenen 
Altersstufen  nicht  weit  genug,  um  obigen  Berechnungen  schon 
einen  auch  für  anderes  Material  gültigen  Wert  zuzuschreiben. 
Soviel  aber  scheinen  sie  doch  schon  einwandfrei  zu  zeigen,  daß 
der  IQ.  ein  sehr  viel  brauchbareres  Maß  des  Eückstandes  darstellt 
als  der  sonst  übliche  Differenzwert. 
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Einen  wirklich  konstanten  Ausdruck  für  einen  Schwachsinns- 
grad enthält  er  aber  auch  nicht.  Er  zeigt  vielmehr  mit  steigen- 
dem Alter  eine  sinkende  Tendenz,  die  freilich  innerhalb  der  oben 
genannten  Altersgrenzen  gering  ist,  so  daß  sie  für  viele  Probleme 
vernachlässigt  werden  kann.  Aber  vorher  und  nachher  scheint 
dies  Sinken  schneller  vor  sich  zu  gehen.  Dies  ist  für  die  späteren 
Altersstufen  ganz  selbstverständlich.  Denn  ist  erst  einmal  das 
früher  erörterte  Stülstandsuiveau  erreicht  (für  Debile  beim  lA.  9), 

lA 

so   muß  nunmehr  bei  ständig  wachsendem  LA.  der  Quotient  ^j^-^ 

IjA. 

rapide  an  Wert  fallen.  Der  Schwachsinnige  hat  eben  nicht  nur 
ein  langsameres  Entwicklungstempo  als  der  Normale,  sondern  ist 
auch  in  einem  Lebensalter,  in  dem  der  Normale  seine  L  noch 
immer  weiter  entwickelt,  bereits  beim  Stillstand  angelangt;  und 
so  wird  in  dieser  Zeit  die  Kluft  zwischen  beiden  gewaltig  er- 
weitert. 

Der  IQ.  darf  daher  als  Ausdruck  des  Schwachsinnsgrades  nur 
für  die  Zeit  gelten,  in  der  die  Entwicklung  des  Schwachsinnigen 
noch  im  Gange  ist;  daher  hat  z.  B.  seine  Berechnung  bei  Idioton 
keinen  Sinn,  da  bei  diesen  in  den  für  die  Untersuchung  in  Be- 
tracht kommenden  Jahren  schon  längst  der  Entwicklungsstillstand 
eingetreten  ist.  Die  oben  erwähnte  langsam  sinkende  Tendenz  des 
IQ.  während  der  Entwicklung  bedeutet,  daß  diese  Entwicklung  sich 
mit  ständig  abnehmender  Geschwindigkeit  dem  schließlichen  StiU- 
standsniveau  nähert i). 

Ob  es  gelingen  wird,  einmal  die  Formel  für  einen  wirklich 
konstanten  Schwachsinnskoeffizienten  zu  finden,  muß  der  Zukunft 
überlassen  bleiben. 

b)  Das  Verhalten  zu  den  einzelnen  Tests.  —  Man  darf  nun 
aber  nicht  glauben,  daß  mit  der  Möglichkeit  der  Graduierung  die 
Bedeutung  der  BS.-Methode  für  die  Untersuchung  Schwach- 
sinniger erschöpft  wäre.  Vielleicht  noch  wichtiger  als  diese  ist 
die  mit  Hilfe  der  Methode  mögliche  qualitative  Analyse  des 
einzelnen  Prüflings  und  die  Peststellung,  wie  die  einzelnen 
Tests  an  den  Resultantenwerten  beteiligt  sind.  Die  Untersuchung 
von  Chotzen,  der  zmn  ersten  Male  an  diese  Probleme  heranging, 


^)  Bobertag  legt  in  seiner  letzten  Abhandlung  (40,  11)  besonderen  Nach- 
druck auf  diese  ständige  Entwicklungs Verzögerung  beim  Schwachsinn,  die  er 
durch  eine  graphische  Darstellung  zu  veranschaulichen  sucht. 


Die  psychologischen  Methoden  der  Intelligenzprüfung.  59 

hat  bewiesen,  welche  verwirrende  Mannigfaltigkeit  von  Gesichts- 
punkten hier  auftaucht. 

Zunächst  muß  sich  ja  gleich  die  Frage  aufdrängen:  Haben 
wir  denn  überhaupt  ein  Eecht  dazu,  ein  zehnjähriges  debiles  Kind, 
weil  die  Testberechnung  das  lA.  7  ergibt,  einem  siebenjährigen 
normalen  Kinde  gleichzusetzen,  also  den  Schwachsinn  als  ein 
wirkliches  „Zurückbleiben"'  zu  charakterisieren?  Es  wird  ja  oft 
genug  behauptet,  daß  dieser  Ausdruck  irreleitend  sei,  da  Schwach- 
sinn etwas  qualitativ  anderes  als  Normalität  sei.  Nur  die  BS.- 
Methode  ermöglicht  es,  diese  Vergleichung  exakt  durchzuführen. 

Und  da  erkennt  man  denn  in  der  Tat,  daß  das  lA.  7  beim 
zehnjährigen  debilen  Kind  nicht  auf  ganz  dieselbe  Weise  zu- 
stande kommt  wie  das  gleiche  lA.  beim  siebenjährigen  normalen 
Kind;  die  Staffelstreuung  ist  nämlich  beim  schwach- 
sinnigen Kinde  sehr  viel  größer  als  beim  normalen 
(Bobertag  berechnete  sie  auf  etwa  den  doppelten  Wert^).  Das 
heißt  also:  die  Treffer  und  Nieten  verteilen  sich  beim  älteren 
schwachsinnigen  Kinde  über  sehr  viel  mehr  Altersstaffeln  der 
Tests  als  beim  jüngeren  normalen;  der  Debile  versagt  unerwartet 
bei  einzelnen  ganz  leichten  Tests,  er  genügt  dafür  vereinzelten, 
viel  höheren  Anforderungen.  Es  ist  eine  gewisse  Dissoziation 
zwischen  Leistungsfähigkeiten  eingetreten,  die  normalerweise  in 
stärkerer  Korrelation  stehen. 

Wir  sind  nun  auch  in  der  Lage,  ein  Hauptprinzip  für 
diese  Dissoziation  ausfindig  zu  machen.  Es  gibt  nämlich 
gewisse  Leistungen,  die  wesentlich  eine  Funktion  des 
Alters  sind,  relativ  unabhängig  von  der  L,  andere,  die 
rein  durch  einen  bestimmten  Grad  der  L-Entwicklung  be- 
stimmt sind,  gleichgültig,  in  welchem  Alter  diese  er- 
reicht wird.  In  bezug  auf  die  erste  Gruppe  wird  das  9-  und 
10  jährige  Kind,  auch  wenn  es  debil  ist,  weiter  sein,  als  das  6-  und 
7jährige  normale  Kind;  bei  der  zweiten  Gruppe  von  Leistungen 
muß  der  Normale  den  Schwachsinnigen  übertreffen. 

A  priori  wird  man  vermuten,  daß  zur  Gruppe  der  Leistungen 
mit  reiner  Altersentwicklung  solche  gehören  werden,  die  von 
einer  Summe  häufig  gemachter  Alltagserfahrungen  und  ständig 
geübter  Alltagsverrichtungen  abhängen.  Aber  solche  vagen  Ver- 
mutungen  nützen   nicht   viel,   und   so   wird   es   denn   von  hohem 


^)   Noch  nicht  veröffentlicht. 
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Wert  sein,  daß  wir  aus  der  Analyse  der  BS. -Ergebnisse  lernen 
können,  welche  Tests  bei  den  Schwachsinnigen  mehr  mit  dem 
Alter  und  welche  mehr  mit  der  eigentlichen  Intelligenz  korre- 
lieren. Bisher  sind  hierfür  allein  die  Ergebnisse  von  Chotzen 
verwendbar,  und  auch  sie  geben  nur  ein  unvollständiges  Bild, 
weil  Ch.  es  ganz  überwiegend  mit  Schwachsinnigen  einer  be- 
stimmten Altersgruppe  (8 — 9  jährigen)  zu  tun  hatte. 

Ch.  gibt  eine  ganze  Eeihe  verschiedener  Berechnungen,  um 
die  „Wertigkeit"  der  verschiedenen  Tests  für  die  Schwachsinns- 
diagnose nachzuweisen;  man  erkennt  erst  aus  diesen  schwierigen 
Darlegungen,  bis  zu  welchen  Komplikationen  ein  wirkliches  Ein- 
dringen in  die  Tiefen  des  Staffelsystems  führt.  Da  eine  Wieder- 
holung solcher  Untersuchungen,  insbesondere  auch  bei  Schwach- 
sinnigen höheren  Lebensalters,  dringend  erwünscht  ist,  so  seien 
hier  die  von  Chotzen  augewandten  Yerfahrungsweisen  zur  Test- 
bewertung kurz  genannt. 

Am  einfachsten  ist  natürlich  der  direkte  Vergleich  von 
schwachsinnigen  mit  normalen  Kindern  gleichen  Lebensalters  (nach 
Bobertags  Befunden). 

Hier  war  die  Rückständigkeit  der  Schwachsinnigen  am  geringsten  bei  folgen- 
den Tests*):  Vor-  und  Nachmittag  unterscheiden;  Definitionen  durch  Zweokangaben ; 
Altersangabe;  ästhetisches  Urteil;  Angabe  der  Fingerzahl;  Bildbeschreibung;  Ab- 
zählen von  13  Pfennigen.  Dagegen  war  die  Rückständigkeit  sehr  groß  bei: 
Nachsprechen  von  16  Silben  und  von  5  Zahlen;  auf  1  Mark  80  Pfennige 
herausgeben;  Rückwärtszählen  von  20  bis  0;  Definition  durch  Oberbegriff; 
Vergleichung  zweier  G^enstände  aus  dem  Gedächtnis;  Wiedergabe  einer 
kleinen  Greschichte ;  Monate  aufzählen ;  5  Gewichte  ordnen. 

Bei  einer  anderen  Altersstufe  wird  sich  der  Aspekt  vermutlich 
wieder  ändern.  So  ist  es  zweifellos,  daß  die  Bilderklärung, 
die  von  älteren  verlangt  wird,  einen  gewaltigen  Unterschied  zwi- 
schen Schwachsinnigen  und  Xornialen  zeitigen  würde,  während 
die  von  jüngeren  geforderte  Biklbeschreibung  nach  Chotzen 
keine  solche  Wirkung  hat. 

Immerhin  zeigt  auch  schon  obige  Aufzählung  Chotzens, 
daß  die  geringe  Differenz  namentlich  bei  solchen  Tests  besteht,  die 
sich  auf  häufig  geübte  Leistungen  (Abzählen.  Altersangabe)  und 
Alltagserfahnuigen  (Fingerzahl,  Vor-  und  Nachmittag)  beziehen; 
dagegen  springt  die  ganze  Eückständigkeit  des  Schwachsinnigen 
sofort  hervor,  wo  Ungewohntes  verlangt.  Neues  dargeboten  und 
eine  scharfe  Aufmerksamkeitsspannung  beansprucht  wird. 

*)  44,  S.  440. 
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Einen  ähnlichen  Vergleich  kann  man  nun  aber  innerhalb 
der  Hilfsschüler  vornehmen  zwischen  den  verschiedenen  Schwach- 
sinnsgruppen, wie  sie  die  medizinische  Diagnose  zeigt;  Ch.  stellte 
fest,  welche  Tests  bei  gleichem  Lebensalter  von  einer  Gruppe  zur 
anderen  besonders  stark  abnahmen.  Ich  erwähne  nur  diejenigen, 
welche  deutlich  doppelten  Abfall  zeigten  (von  den  Nichtschwach- 
sinnigen zu  den  Debilen,  und  dann  wiedermn  zu  den  Imbezülen)i). 

Bei  8-  bis  9jährigen  Kindern:  Rhombus  abzeichnen,  5  Zahlen  nach- 
sprechen, leichte  l.-Fragen;  etwas  geringer  war  der  Abfall  für:  fünf  Münzen, 
Vergleich  von  zwei  Gegenständen. 

Bei  älteren  Kindern  (Ch.  hatte  nachträglich  zu  Vergleichszwecken  noch 
eine  Reihe  älterer  Hilfsschüler  geprüft) :  Vergleich,  Wiedergabe  einer  Zeitungs- 
notiz, 5  Gewichte  ordnen,  auf  1  Mark  80  Pfennig  herausgeben,  Definitionen 
durch  Oberbegriffe,  Kenntnis  aller  Münzen,  Nachsprechen  von  5  Zahlen. 

Eine  dritte  Berechnung  veranstaltet  endlich  Ch.  durch  Ver- 
gleichung  derjenigen  Prüflinge,  die  auf  demselben  lA.,  aber  in 
verschiedenem  LA.  stehen.  Das  lA.  kann  ja  dadurch  zustande 
kommen,  daß  ein  8  jähriges  Kind  um  2,  oder  daß  ein  9  jähriges  um 
3,  oder  daß  ein  10  jähriges  um  4  Jahr  im  Rückstand  ist.  Nun 
gibt  es  Tests,  welche  bei  Eindern  einer  I. -Stufe  deutliche  Zu- 
nahme der  Leistungen  mit  dem  Lebensalter  zeigen,  andere,  die 
Konstanz,  endlich  solche,  die  sogar  eine  Abnahme  aufweisen.  Die 
erstgenannten  Tests  mit  „Alterszuwachs"  sind  zweifellos  solche, 
die  am  wenigsten  mit  der  I.  zu  tun  haben,  da  sie  bei  gleicher  I. 
von  den  älteren  Kindern  besser  geleistet  werden.  Dagegen  sind 
die  anderen  Tests  deutlich  mit  der  I.  in  Korrelation,  ganz  beson- 
ders diejenigen,  bei  denen  die  älteren  Kinder  sogar  schlechter 
abschneiden.   Es  ergibt  sich  nun : 

Starken  Alterszuwachs  zeigen:  Abschreiben,  Diktat  schreiben,  das 
Wiedergeben  von  zwei  Einzelheiten  aus  einer  Geschichte,  Aufzählen  der 
Wochentage. 

„Die  T.  mit  dem  starken  Alterszuwachs  betreffen  also  ausschließlich 
Kenntnisse,  insbesondere  Schulkenntnisse,  bei  deren  Aneignung  es  auf  die 
Dauer  des  Unterrichts  ankommt.  Wo  nur  ein  geringer  Zuwachs  zu  ver- 
zeichnen ist,  da  spielen  Kenntnisse  bei  einigen  wohl  auch  eine  Rolle 
(5  Münzen,  Alter),  ziuneist  aber  sind  es  T.,  bei  denen  Übung,  aber  auch  die 
natürliche  Zunahme  der  Leistungsfähigkeit  die  Resultate  fördern  wird  (z.  B. 
Ausführen  dreier  Aufträge,  Rückwärtszählen,  Nachsprechen  von  16  Silben). 
Bei  allen  diesen  ist  der  Alterszuwachs  gering.  Ganz  ohne  ihn  sind  Urteils- 
und  Kombinationsleistungen    oder    solche,    die    hohe   Anforderungen    an   die 

1)  44.  S.  458. 
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Auffassung  stellen  (Vergleiche,  Intelligenzfragen,  Lücken  erkennen,  5  Zahlen 
nachsprechen)  1)/' 

Wahrscheinlich  gehören  zur  letzten  Kategorie  auch:  Wiedergabe  von 
sechs  Einzelheiten  aus  einer  Geschichte,  Ordnen  der  5  Gewichte,  Bild- 
erkläiTmg,  80  Pfennig  auf  1  Mark  herausgeben;  doch  sind  hier  die  Zahlen 
für  feste  Ergebnisse  zu  klein. 

Vergleicht  man  nun  diese  auf  verschiedenem  Wege  gewonne- 
nen Listen  miteinander,  so  zeigen  sie  zwar  in  manchen  Einzel- 
heiten Abweichungen;  aber  im  großen  und  ganzen  treten  doch 
immer  wieder  dieselben  Tests  auf,  als  diejenigen,  in  welchen  sich 
der  I. -Defekt  unverhüllt  und  unkompensiert  offenbart,  während  bei 
anderen  die  verringerte  I.  durch  das  höhere  Alter  wettgemacht 
werden  kann. 

Werden  solche  Untersuchungen  mit  größeren  Zahlen  Schwach- 
sinniger aus  verschiedenen  Lebensaltern  fortgesetzt,  so  ist  zu 
hoffen,  daß  man  über  die  ganze  Struktur  der  defekten  I.  in  ver- 
schiedenen Entwicklungsstufen  und  Schwachsinnsgraden  bald  zu 
einer  wesentlich  vertieften  Einsicht  kommen  wird. 

c)  Intelligenz  und  Schulfähigkeit.  —  Das  Problem,  das 
uns  schon  bei  den  normalen  Kindern  begegnete  (S.  39ff.),  kehrt 
bei  den  abnormen  wieder  und  führt  auch  zu  ganz  ähnlichen  Er- 
gebnissen. Es  fand  sich  nämhch  nur  eine  partielle  Übereinstimmung 
zwischen  der  Größe  des  I. -Defekts  und  der  Herabsetzung  der 
Schulfähigkeit..  Nach  Kram  er  gab  es  freilich  eine  große  Anzahl 
von  Kindern,  die  der  Schulklasse  nach  um  ebensoviel  Jahresgrade 
rückständig  waren,  wie  der  I.  nach,  daneben  aber  recht  viele 
mit  wesentlich  stärkerem  Schul-  als  I. -Rückstand  (das  umgekehrte 
kam  fast  nie  vor).  Ja,  ^s  gab  auch  Kinder  mit  völliger  Schul- 
unfähigkeit, ohne  daß  ein  entsprechender  L -Defekt  nachweisbar 
gewesen  wäre. 

Desgleichen  gab  es  unter  den  acht-  und  neunjährigen  der  Hilfs- 
schule überwiesenen  Kindern  Chotzens  eine  große  Zahl,  die 
nicht  den  (von  Bin  et  für  diesen  Zweck  geforderten)  Rückstand 
von  zwei  Jahren  hatten  und  dennoch  durchaus  in  die  Hilfsschule 
gehörten,  weil  sie  in  der  Normalschule  gänzlich  versagten. 

Dieser  nicht  intellektuell  bedingte  Schulrückstand  ist  ja  bei 
einem  Teil  der  Fälle  auf  äußere  Umstände:  besonders  schlechte 
häusliche   Verhältnisse,   Verwahrlosung,   Orts-   und   Schulwechsel, 

')  44,  S.  453. 
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längere  Krankheit  zurückzuführen.  Zu  einem  anderen  Teil  wirkt 
hier  aber  ein  inneres  Manko  mit:  jene  Willenseigenschaften, 
welche  zur  I.  ergänzend  hinzutreten  müssen,  um  brauchbare  Men- 
schen zu  erzeugen,  sind  nicht  der  Intelligenz  entsprechend  ent- 
wickelt. Es  sind  also  die  Moralisch-Schwachsinnigen:  „Kinder 
dieses  Typus  fügen  sich  naturgemäß  sehr  schlecht  in  die  Schul- 
disziplin, schwänzen  den  Unterricht,  treiben  allerlei  Unfug  in 
der  Klasse,  sind  durch  Strafen  ganz  unbeeinflußbar  usw.,  so  daß 
sie  trotz  guter  Intelligenz  mehr  oder  minder  häufig  sitzenbleiben. 
Als  besonders  ungünstig  erwiesen  sich  diejenigen  Fälle,  in  denen 
neben  diesen  psychischen  Anomalien  auch  intellektuelle  Defekte 
geringen  Grades  bestanden^)." 

5.    Gesichtspunkte   für   die   Aus-   und   Umgestaltung   der 

Staffelmethode. 

Die  vorangegangene  Betrachtung  hat  bereits  eine  Reihe  von 
mehr  oder  minder  schweren  Mängeln  der  BS.-Methode  aufgedeckt; 
und  diese  Mängel  sind  auch  durch  die  von  Binet  selbst  im 
Jahre  1911  angegebene  Revision  seiner  Serie  nicht  beseitigt.  Bei 
fast  allen  Benutzern  der  Methode  finden  wir  irgend  welche 
Schwächen  hervorgehoben ;  manche  gehen  auch  über  die  bloße 
Kritik  hinaus  und  machen  Umgestaltungs-  und  Ergänzungsvor- 
schläge oder  wenden  sogar  bereits  in  diesem  oder  jenem  Punkt 
ein  verändertes  Verfahren  an. 

Nun  wäre  es  aber  sehr  bedenklich,  wenn  an  einem 
international  verwandten  Forschungsinstrument  die  einzelnen 
Untersucher  auf  Grund  subjektiven  Beliebens  und  zufälliger 
Einzelkritik  ständig  Änderungen  vornähmen;  es  wird  einer- 
seits das  System,  in  welchem  jeder  Test  mit  jedem  anderen  in 
eigentümlicher  Verknüpfung  steht,  durch  Plickwerk  an  Einzel- 
stellen in  seinem  Gleichgewicht  bedroht,  und  es  wird  andererseits 
die  Vergleichbarkeit  der  Ergebnisse  verschiedener  Forscher  auf- 
gehoben. 

Es  empfiehlt  sich  daher,  künftig  folgendermaßen  zu  verfahren. 
Dort,  wo  es  sich  um  das  Gewinnen  inhaltlicher  Ergebnisse,  um 
Prüfung  von  Kindern  zu  praktischen  Zwecken  usw.  handelt,  möge 
man  zunächst  noch  an  dem  alten  System  trotz  seiner  offenkundigen 
Mängel  festhalten.    Unabhängig  hiervon  aber  möge  man  methodo- 


>)  Kram  er  54,  S.  31. 


54  ^-  Stern. 

logisch  gerichtete  Untersuchungen  aufnehmen,  welche  die  Her- 
stellung eines  nach  allen  Seiten  hin  reformierten  Staffel- 
systems zum  Endziel  haben.  Dies  aber  kann  der  einzelne  Forscher 
wegen  der  Vielgestaltigkeit  der  zu  lösenden  Probleme  und  der 
notwendigen  Massenhaftigkeit  der  zu  prüfenden  Individuen  nicht 
leisten;  vielmehr  wird  hier,  wenn  irgendwo,  die  jetzt  in  der 
Psychologie  überall  geforderte  Arbeitsgemeinschaft  und  Arbeits- 
teilung am  Platze  sein. 

Um  eine  solche  anzubahnen,  zähle  ich  hier  die  Hauptpunkte 
auf,  die  bei  dieser  Reformarbeit  in  Betracht  kommen  und  stelle 
auch  schon  einige  konkrete  Reformvorschläge  zur  Erörterung. 

a)  Auswahl  und  Eichung  der  einzelnen  Tests.  Die 
Kritik  an  den  einzelnen  Tests  ist  bald  von  theoretischen  Er- 
wägungen, bald  von  empirischen  Befunden  ausgegangen.  Theo- 
retisch verfälirt  Ayres  (31),  der  selbst  keine  Untersuchungen  an- 
gestellt hat.  Er  bemängelt  an  den  Tests,  daß  sie  zu  wenig  direkte 
Beziehungen  zur  praktischen  Intelligenz  hätten.  Sie  beträfen 
vornehmlich:  den  fließenden  Gebrauch  der  Sprache,  die  Merk- 
fähigkeit, das  Verhalten  zu  Vexieraufgaben,  die  völlig  lebensfremd 
seien,  zum  Teil  auch  Fertigkeiten,  die  in  hohem  Maße  vom  Unter- 
richt und  von  häuslichen  Milieueinflüssen  abhängig  wären,  sodann 
das  Arbeiten  mit  abstrakten  Begriffen,  mit  denen  es  doch  nur  die 
Philosophen  zu  tun  hätten  ( ! )  —  dagegen  nicht  die  Fähigkeit,  sich 
im  Leben  handelnd  zu  betätigen;  es  müßten  mehr  „doing  tests" 
eingeführt  werden.  Wenn  auch  seine  Kritik  in  manchen  Dingen 
recht  hat,  so  scheint  doch  hier  die  Grundtatsache  übersehen  zu 
sein,  daß  I.  eine  formale  Fähigkeit  ist,  und  daß  diese  auch  her- 
vortreten muß  bei  Aufgaben,  wie  sie  inhaltsgleich  im  wirk- 
lichen Leben  nicht  vorkommen.  Ja,  solche  Aufgaben  haben  den 
methodischen  Vorteil,  daß  für  sie  sicher  keine  unkontrollierbare 
Einübung  besteht. 

Wichtiger  sind  die  Kritiken,  die  an  die  empirische  Nach- 
prüfung der  Tests  geknüpft  wurden.  Bei  manchen  Tests  ergab  sich 
in  der  Tat  eine  zu  starke  Abhängigkeit  von  Schul-  und  Umwelt- 
einflüssen, andere  waren  nicht  eindeutig  einer  bestimmten  Alters- 
stufe zuzuordnen  oder  zeigten  bei  Kindern  von  unverkennbarem 
I. -Unterschied  keine  deutliche  Verschiedenheit  der  Leistungen. 
Ferner  sind  solche  Tests  zu  beanstanden,  bei  denen  die  Wahr- 
scheinlichkeit  groß    ist,    daß    die    Antwort   durch    bloßen    Zufall 
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richtig  wird,  wie  bei  den  Tests  „rechte  Hand,  linkes  Ohr  zeigen". 
„Ist  jetzt  Vormittag  oder  Nachmittag?" 

Die  Eignung  eines  Tests,  überhaupt  angcAvandt  zu  werden,  und 
seine  Zugehörigkeit  zu  einer  bestimmten  Altersstufe  wird  in  Zu- 
kunft mit  verschiedenen  Mitteln  untersucht  werden  können. 

Da  ist  zuerst  das  Verhalten  der  Altersstufen  zu  dem 
Test  zu  verwerten. 

Im  allgemeinen  muß  man  von  einem  Test,  der  für  eine  ge- 
wisse Staffel  gelten  soll,  verlangen,  daß  ungefähr  7 5  o/o  aller 
Kinder  dieser  Altersstufe  den  Test  leisten.  Dies  würde  dem  oben 
(S.  30 f.)  erörterten  normalen  Verteidigungsmodus  entsprechen;  und 
in  der  Tat  haben  sowohl  Bober  tag,  wie  neuerdings  Bell  (32)  die 
Zuordnung  bestimmter  Tests  zu  bestimmten  Altersstufen  nach 
diesem  Prinzip  geprüft  (Terman  und  Childs  (63)  wählen  den 
Wert  660/0,  der  aber  aus  früher  besprochenen  Gründen  weniger 
geeignet  erscheint). 

Allein  das  Prinzip  genügt  für  sich  noch  nicht,  denn  es  besagt 
nicht,  ob  der  Test  gerade  nur  für  diese  Altersstufe  und  nicht 
auch  ebenso  oder  fast  ebenso  für  eine  andere  charakteristisch 
wäre.  Dazu  muß  die  Häufigkeit  der  Lösung  auch  für  andere 
Altersstufen  geprüft  werden;  und  derjenige  Test  ist  am 
brauchbarsten,  der  den  steilsten  Altersfortschritt  zeigt 
(auf  dies  methodische  Hilfsmittel  hat  zuerst  Bob  er  tag  aufmerk- 
sam gemacht). 

Fingieren  wir  zur  Veranschaulichung  ein  Beispiel.    Zwei  Tests  mögen 
gleichmäßig  bei  9  jährigen  Kindern  75  %  Lösungen  erzielt  haben.     Aber  der 
eine  Test  zeigt  bei  8-  und  10jährigen  nur  wenig  verschiedene  Häufigkeits- 
Häufigkeit  der  Lösungen  bei 
Sjähr.       9jälir.       lOjähr. 

Test  a:  65  0/0         75  «/o  80 «/o 

Test  b:  45  »/o        75o/o         BO»/,, 

zalilen,  der  zweite  große  Unterschiede.  Demnach  betrifft  Test  b  eine  Leistung, 
die  für  die  Qjährigeu  —  im  Gregensatz  zu  den  8jälirigen  —  eben  normal 
geworden  ist,  während  sie  bei  den  lOjährigen  bereits  so  gut  wie  selbst- 
verständlich funktioniert;  b  ist  also  der  brauchbarere  Test. 

Da  der  seelische  Entwicklungsprozeß  sukzessiv  verschiedene 
Teilfunktionen  zur  Reife  bringt,  so  muß  es  für  jede  Altersstufe 
eine  Reihe  von  Tests  geben,  die  gerade  den  jetzt  eingetretenen 
Reifungsphänomenen  entsprechen;  mit  Hilfe  des  Prinzips  des 
steilen  Altersfortschritts  muß  es  gelingen,  diese  Tests  aus  der  Zahl 
der  anderen  herauszufinden. 

5 
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Weiter  wird  für  die  Auslese  der  Tests  auch  die  Überein- 
stimmung zwischen  den  Ergebnissen  verschiedener  Unter- 
suchungen beachtet  werden  müssen.  Ein  Test,  der  bei  deutschen, 
französischen,  englischen,  amerikanischen  Kindern  immer  die  gleiche 
oder  sehr  ähnliche  Alterseichung  erhält,  hat  natürlich  mehr  An- 
spruch, in  das  endgültige  System  aufgenommen  zu  werden,  als  ein 
solcher,  der  mit  dem  Prüfer  oder  mit  den  Prüflingen  stark  variiert 
Lehrreich  ist  in  dieser  Hinsicht  eine  Tabelle,  die  Bell  gibt.  Erstellt 
für  jeden  Test  des  BS. -Systems  die  Jahreseichungen  nebeneinander, 
die  auf  Grund  der  Ergebnisse  Binets,  Levistre  und  Morles, 
Johnstones,  Goddards,  Bobertags,  Terman  und  Childs  er- 
halten wurden  (32)  i). 

Bei  manchen  Tests  sind  die  Abweichungen  sehr  groß;  so  schwankt  der 
Test  „zwei  Gegenstände  aus  dem  Gedächtnis  zu  vergleichen",  zwischen  der 
Staffel  6  Jahr  (Johnstone)  und  9  Jahr  (Terman  und  Childs),  der  Test 
,,60  Worte  in  drei  Minuten  nennen",  zwischen  der  Staffel  10  Jahr  (Goddard) 
und  15  Jahr  (Levistre  und  Morle,  Terman  und  Childs).  Die  Zu- 
weisung eines  solchen  Test  an  irgend  eine  einzelne  Jahresstufe  bleibt  dann 
natürlich  ein  Willkürakt.  Ihnen  stehen  andere  Tests  gegenüber,  die  bisher 
große  Konstanz  zeigten.  So  schwankt  bei  „13  Pfennige  zählen",  „Ver- 
gleichung  schöner  und  häßlicher  Gesichter  auf  Bildern",  „rechte  Hand, 
linkes  Ohr  zeigen"  die  Eichung  nur  zwischen  6  und  7  Jahren,  bei  „Lücken 
in  Bildern  erkennen"  zwischen  7  und  8,  bei  dem  Test  „von  20  rückwärts 
zählen"  zwischen  8  und  9  Jahren,  bei  „Monate  aufzählen"  zwischen  9  und 
10  Jahren.  Der  Test  „schwere  Verstandesfragen"  erhält  bei  allen  Untersuchem 
mit  Ausnahme  von  Goddard  die  Eichung  12  Jahr  usw. 

Man  erkennt,  daß  es  sich  größtenteils  hierbei  um  Tests  handelt, 
bei  denen  die  sprachliche  Formulierung  keine  oder  keine  große 
Rolle  spielt.  Es  ist  ja  natürlich,  daß  dort,  wo  Aufgabe  und  Ant- 
wort stark  von  dem  sprachlichen  Ausdruck  abhängig  sind,  die 
nationale  Besonderheit  hervortreten  muß ;  diese  Fehlerquelle  wird 
aber  verringert  werden  können,  wenn  man  mehr  als  bisher  darauf 
achtet,  die  Übertragung  des  Tests  aus  einer  Sprache  in  die  andere 
möglichst  dem  Sprachgefühl  und  dem  Kulturbewußtsein  der  an- 
deren Nation  anzupassen  und  so  gleiche  Schwierigkeit  der  Auf- 
gabe zu  erzielen:  die  wörtliche  Übersetzung,  die  von  manchen 
Untersuchern  vorgenommen  wurde,  läßt  diese  Forderung  oft  un- 
erfüllt.  So  ergab  z.  B.  die  ziemlich  freie  Übertragung,  die  Bober- 


^)  Allerdings  sind  die  Tabellen  und  MateriaHen,  aus  denen  Bell  die  Zusammen- 
stellungen machen  mußte,  bei  den  verschiedenen  Forschern  so  ungleichartig  kon- 
struiert, daß  deren  Jahreseichungen  nicht  ohne  weiteres  vergleichbai*  sind.  Die 
Tabelle  darf  daher  nur  als  erster  i)ro\"isorischer  Versuch  gewertet  werden. 
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tag  für  Deutschland  vornahm,  oft  bessere  Übereinstimmung  mit 
Binets  Ergebnissen,  als  die  wörtlichen  Übersetzungen  der 
Amerikaner. 

Endlich  wird  man  den  Wert  eines  Test  auch  danach  abzu- 
schätzen haben,  ob  er  Unterschiede  der  Intelligenz,  die  aus 
anderen  Quellen  her  bekannt  sind,  deutlich  zum  Ausdruck  bringt. 
Bezüglich  der  bisherigen  Biuettests  hat  Mlle.  Descoeudres  eine 
einschlägige  Untersuchung  —  freilich  an  einer  sehr  geringen 
Kinderzahl  —  angestellt  (46).  Aus  sechs  Jalirgängen  einer  Knaben- 
und  einer  Mädchen  Volksschule  wurde  je  ein  „intelligentes"  mid 
ein  „uniutelligentes"  Kind  geprüft;  für  die  Auswahl  war  das 
Urteil  der  Lehrer  über  die  I.  der  Kinder  bestimmend.  Verglich  sie 
nun  insgesamt  die  Testergebnisse  der  12  unintelligenten  mit  denen 
der  12  intelligenten  Kinder,  so  ergab  sich,  daß  die  Differenz  bei 
den  verschiedenen  Tests  in  sehr  wechselndem  Maße  hervortrat. 
Diejenigen  Tests,  bei  denen  die  intelligenten  den  deutlichsten  Vor- 
sprung vor  den  unintelligenten  hatten  (die  daher  in  erster  Reihe 
als  wirkliche  I. -Tests  betrachtet  werden  dürfen),  sind  in  der  ersten 
Rubrik  von  Tab.  XIV  aufgezählt. 

Tab.  XIV. 


Bei  folgenden  Binet-Tests  zeigte  sich  ein  besonders  deutlicher 
Leistungsunterechied 


zwischen  intelligenten  u. 

unintelligenten  Normalen 

(Descoeudres) 


zwischen  normalen  und 

Schwachsinn.  Kindern 

(Chotzen) 


zwischen  Schwachsinn.  K. 
verschied.  Schwachsinns- 
grades (Descoeudres) 


Ordnen  von  5  Ge- 
wichten 
Defin.,  die  üb.  Zweck 
hinausgehen 
Rückwärtszählen 
Bilderklärung 
Erkennen  von  Lücken  in 
Figuren 

Kritik  absurder  Sätze 


Ordnen  von  5  Ge- 
wichten 
Defin.,  die  üb.  Zweck 
hinausgehen 
Eückwärtszählen 

Vergleich  zweier 
Gegenstände  aus  dem 

Gedächtnis 

Merkfähigk.  für  5  Zahlen, 

16  Silben,   1  Geschichte 

Monate  aufzählen 

Geld  herausgeben 


Definitionen 


Bildbeschreibung 

Vergleich  zweier 

Gegenstände  aus  dem 

Gedächtnis 

Intelligenzfragen 


Dieselbe  Forscherin  hat  dann  aber  noch  eine  Untersuchung 
an  schwachsinnigen  Kindern  vorgenommen,  die  zum  Vergleich  mit 
herangezogen  sei  (73).  [Sie  wird  uns  in  einem  anderen  Zusammen- 
hang später  ausführlicher  beschäftigen.]     Die  Kinder  wurden  nach 


68  W.  Stem. 

ihrem  Schwachsinnsgrad  schätzungsweise  in  eine  Eeihe  geordnet; 
hiermit  wurde  ihre  Leistungsfähigkeit  in  bezug  auf  15  verschie- 
dene Tests  verglichen.  Unter  diesen  fanden  sich  6  BS. -Tests, 
von  denen  4  außerordentlich  hohe  Korr.  mit  der  geschätzten  I. 
(zwischen  0,80  und  0,88)  lieferten.  Sie  sind  in  der  dritten  Rubrik 
von  Tab.  XTV  genannt.  Weniger  gut  war  die  Übereinstimmung  beim 
Erkennen  von  Münzen  und  beim  Nennen  von  60  Worten  in  drei 
Minuten. 

Und  drittens  haben  wir  uns  der  schon  früher  erwähnten  Er- 
gebnisse Chotzens  zu  erinnern  (s.  S.  60),  wonach  gewisse  Tests 
weit  mehi-  als  andere  den  Unterschied  von  normalen  und  schwach- 
sinnigen Kindern  gleichen  Alters  zum  Ausdruck  bringen.  Diese 
sind  in  der  Mittelrubrik  der  Tabelle  genannt. 

Bemerkenswert  ist  nun,  daß  die  meisten  Tests  in  den  drei 
Rubriken  mehrfach  vorkommen,  trotzdem  doch  die  drei  Unter- 
suchungen mit  Kindern  ganz  verschiedenen  Alters  und  auch  sonst 
unter  abweichenden  Bedingungen  angestellt  sind.  Damit  ist 
bewiesen,  daß  gewisse  Tests  besonders  geeignet  sind,  I.-Unter- 
schiede  deutlich  hervorspringen  zu  lassen,  und  es  ist  zugleich  der 
Weg  gezeigt,  um  diese  recht  eigentlichen  I. -Tests  aus  der  Zahl  der 
übrigen  herauszuheben  i). 

Natürlich  besteht  kein  Grund,  derartige  Kontrollen  nur  auf 
die  von  Bin  et  bereits  benutzten  Tests  zu  beschränken;  denn  Ver- 
gleichungen  zwischen  intelligenten  und  nichtintelligenten  Schü- 
lern sind  ja  mit  den  verschiedensten  Tests  von  Meumann, 
Winteler,  Cohn-Dieffenbacher  und  zahlreichen  ausländischen 
Forschern  angestellt  worden;  und  es  werden  sich  aus  diesen  und 
künftigen  Untersuchungen  gleicher  Art  sicherlich  gewisse  Tests 
von  so  starkem  Symptomwert  ergeben,  daß  sie  für  die  Aufnahme 
in  das  Staffelsystem  eingerichtet  zu  werden  verdienen.  —  Es  sei 
in  diesem  Zusammenhang  u.  a.  auf  die  kürzlich  von  Meumann 
vorgeschlagene  Modifikation  der  Masseion  sehen  Probe  verwiesen 
(s.  S.  12),  einen  Test,  der  nach  M.s  Angaben  von  Intelligenten  ge- 
wöhnlich mit  logischer  Pointe,  von  den  Unintelligenten  pointenlos 
gelöst  wird. 


1)  Noch  eine  weitere  Übereinstimmung  darf  nicht  unerwähnt  bleiben: 
auch  die  Differenzierimg  nach  sozialen  Sclüchten  war  ziun  großen  Teil  durch 
dieselben  charakteristischen  Tests  gekennzeichnet,  wie  oben  die  I.-Verschieden- 
heit  (s.  S.  37  f.). 
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Auch  die  Korrelations-Untersuchung,  über  welche  im  näch- 
sten Abschnitt  zu  berichten  ist,  liefert  manche  Tests,  deren  Er- 
gebnisse in  starker  Übereinstimmung  mit  der  Intelligenzschätzung 
stehen.  Diese  Tests  sind  zwar  nicht  ohne  weiteres  in  das  Staffel- 
system einzuordnen,  weil  sie  mit  feinen  Abstufungen  arbeiten, 
während  die  Binetskala  nur  Tests  mit  der  Alternative  „richtig"  oder 
.,falsch"  kennt;  möglichenfalls  lassen  sie  sich  aber  umformen,  so  daß 
sie  die  einfachere  für  das  Staffelsystem  geeignete  Gestalt  erhalten. 

Verbindet  man  die  genannten  methodischen  Hilfsmittel,  so 
werden  wir  allmählich  zu  einer  Auslese  von  Tests  kommen,  die 
in  weit  höherem  Maße  als  viele  der  bisherigen  für  die  Intelligenz 
einer  bestimmten  Altersstufe  charakteristisch  und  für  die  ver- 
schiedenen zu  prüfenden  Kulturkreise  und  Nationen  homogen  sind. 

b)  Die  Zusam^menstellung  von  Serien  für  die  ein- 
zelnen Jahrgänge.  Da  die  Intelligenz  eine  formale  Fähigkeit 
ist,  die  nur  durch  vielseitige  Prüfung  festgestellt  werden  kann,  so 
muß  schon  auf  jeder  Altersstufe  für  Mannigfaltigkeit  der  Tests  ge- 
sorgt werden.  Es  genügt  daher  nicht,  daß  man  beliebige  Einzeltests 
verbindet,  deren  jeder  für  die  betreffende  Altersstufe  75 o/o  Lösun- 
gen bietet.  Sind  die  Tests  einander  zu  ähnlich,  so  leistet  ihre 
A^ereinigung  nicht  viel  mehr  als  die  Prüfung  mit  einem  ein- 
zelnen. Bei  BS.  ist  dieser  Gesichtspunkt  nicht  genügend  berück- 
sichtigt; es  gibt  Altersstaffeln,  die  nur  sprachliche,  keine  Hand- 
lungstests enthalten. 

Weiter  müssen  auch  die  Altersstaffeln  als  ganze  geeicht 
werden;  denn  es  ist  etwas  vöUig  anderes,  ob  einzelne  Tests 
oder  ob  die  Gesamtlösung  von  5  Tests  von  einer  Altersstufe  ge- 
fordert wird.  Erschwert  wird  diese  Eichung  dadurch,  daß  man  zur 
Berechnung  des  einzelnen  lA.  nicht  nur  die  Tests  einer  Alters- 
staffel heranziehen,  sondern  auch  Tests  aus  höheren  Stufen  er- 
gänzend hinzunehmen  muJ3 ;  es  sind  daher  bei  dieser  Eichung  die 
für  verschiedene  benachbarte  Altersstufen  in  Aussicht  genomme- 
nen Tests  stets  in  ihrer  Beziehung  zueinander  zu  beachten. 

Als  Prinzip  der  Staffeleichung  hat  eine  einigermaßen  sym- 
metrische Verteilung  der  lA.  für  jede  Altersstufe  zu  gelten; 
die  Tests  sind  dann  richtig  zugeordnet  und  geschickt  zusammen- 
gestellt, wenn  bei  einer  großen  Zahl  unausgewählter  normaler 
Prüflinge  jenes  Alters  eine  mittlere  Hauptgruppe  auf  dem  Niveau 
steht  und  die  übrigen  sich  einigermaßen  gleichmäßig  auf  I.-Eück- 
stand  und  -Vorsprung  verteilen. 
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In  praxi  wird  es  für  solche  Untersuchungen  nötig  sein,  daß 
man  jeden  Schüler  mit  einer  möglichst  großen  Zahl  von  Tests 
piiift;  dann  ist  man  in  der  Lage,  die  Leistungen  für  jeden 
einzelnen  Test  versuchsweise  bald  dieser,  bald  jener  Altersstaffel 
zuzuschieben  und  diejenige  Gesamtanordnung  zu  finden,  bei  der 
am  ehesten  eine  symmetrische  Verteilung  erreicht  wird. 

Noch  exakter  kann  die  Untersuchung  werden,  wenn  man  für 
diese  Verteilungskurven  nicht  das  lA.,  sondern  den  IQ.  benutzt; 
denn  dann  haben  wir  auch  für  die  verschiedenen  Altersstufen 
einigermaßen  übereinstimmende  Verteüungskurven  zu  erwarten. 
Es  wären  dann  innerhalb  jeder  Altersstufe  die  IQ.  von  10  zu  10 o/o 
zusammenzufassen,  also  die  Kinder  mit  IQ.  0,91 — 1,00  und  1,01 
bis  1,10,  welche  die  kompakte  Mittelgruppe  bilden,  dann  zu  beiden 
Seiten  die  an  Häufigkeit  schnell  abnehmenden  Gruppen:  nach 
unten  die  IQ.  0,81—0,90;  0,71—0,80  .  .  ..  nach  oben  die  IQ. 
1,11—1,20;  1,21—1,30  .  .  . 

Die  Anzahl  der  zu  jeder  Jahresstaffel  gehörigen  Tests  war 
in  dem  älteren  BS.-System  verschieden.  1911  hat  B.  jedem  Jahr- 
gang gleichmäßig  fünf  Tests  zugewiesen;  eine  solche  Gleich- 
förmigkeit wird  sich  auch  in  Zukunft  empfehlen,  da  dadurch  die 
Berechnung  des  Eesultantenwertes  wesentlich  vereinfacht  wird^). 

c)  Die  Erweiterung  des  Systems.  —  Sodann  ist  die  Zu- 
sammenstellung von  Tests  über  die  bisherigen  Grenzen  hinaus 
zu  erweitern,  und  zwar  nach  verschiedenen  Richtungen. 

Am  schwersten  wurde  bisher  das  Fehlen  von  Tests  für 
höhere  Jahrgänge  empfunden.  Was  von  Binet  und  anderen 
an  Tests  über  den  Jahrgang  11  hinaus  geschaffen  war,  hatte  noch 
ganz  den  Charakter  des  Tastenden  und  Provisorischen;  die  Tests 
konnten  höchstens  dazu  dienen,  die  nötigen  Ergänzungen  zu  liefern, 
die  zur  Herstellung  der  lA.  10  und  11  gehören,  aber  zu  einer 
selbständigen  Feststellung  für  die  lA.  12—15  Jahre  reichten  sie 
absolut  nicht  aus.  Es  muß  zugestanden  werden,  daß  das  Finden 
geeigneter  Tests  für  diese  höheren  Stufen  geistiger  Reife  sehr  viel 
schwerer  ist  als  für  die  jüngeren  Kinder;  aber  die  Schwierigkeit 
ist  zu  überwinden.  So  haben  Terman  und  Childs  (64)  neuer- 
dings eine  Reihe  von  Tests  vorgeschlagen,  deren  jeder  einzelne 
in  bezug  auf  die  zu  fordernden  Leistungen  mehrfach  abzustufe]i 
ist,  so  daß  ihre  Anwendung  bis  zum  lA.   15  möglich  sein  soll : 


^)  Vgl.  auch  Bobertags  provisorische  Neuordnung  im  Anhang  IL 
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es  finden  sich  da  unter  anderen  Tests  mit  eingekleideten  arithmeti- 
schen Aufgaben,  Verständnis  für  eine  Liste  ausgesuchter  Wörter, 
ein  „Geueralisationstest"  (die  Moral  von  vorgelesenen  Fabeln  zu 
finden)  und  die  Ebbinghaussche  Ergänzung  von  Textliicken  mit 
fortschreitender  Ei-schwerung  der  Aufgabe^). 

Hoffen  wir,  daß  wir  auf  solche  Weise  langsam  von  Jahr- 
gang zu  Jahrgang  aufsteigen  und  endlich  als  Abschluß  des  ganzen 
Staffelsystems  eine  Serie  für  Erwachsene  schaffen  können;  so  ein- 
fach ist  diese  Aufgabe  jedenfalls  nicht  zu  lösen,  wie  es  Bin  et 
glaubte,  als  er  die  Tests,  die  er  ursprünglich  für  die  Alters- 
stufen 11,  12  und  13  geschaffen  hatte,  später  nach  oben  verschob 
und  die  letzte  Stufe  unter  Hüizufügung  von  zwei  neuen  Tests 
für  die  „Erwachsenen"  bestimmte. 

Sehr  wünschenswert  wäre  ferner  eine  Erweiterung  des  Systems 
durch  Schaffung  von  Parallelserien  für  alle  Jahrgänge^) 
Wie  gern  würden  wir  die  Methode  dazu  benutzen,  die  I. -Entwick- 
lung derselben  Kinder  durch  mehrere  Jahre  hindurch  zu  ver- 
folgen; das  macht  aber  Schwierigkeiten,  weil  ja  das  Kind  den 
gleichen  Tests,  denen  es  schon  früher  ausgesetzt  gewesen,  im 
AViederholungsfall  nicht  mehr  ebenso  gegenübersteht^).  Hätten 
wir  dagegen  andere,  aber  gleichwertige  Serien,  so  wären  häufiger 
wiederholte  Prüfungen  identischer  Individuen  möglich.  Des- 
gleichen könnten  bei  Massenuntersuchungen  solche  Kinder,  zwi- 
schen denen  Kollusionsgefahr  besteht,  mit  verschiedenen  Serien 
geprüft  werden.  Endlich  ist  es  wertvoll,  für  den  Fall,  daß  eine 
Untersuchung  durch  Störung  oder  Ungeschick  unbrauchbar  wird, 
über  ein  Ersatzverfahren  zu  verfügen. 

Wenn  wir  erst  die  unter  a)  verlangten  Durchprüfungen  recht 
vieler  Einzeltests  vorgenommen  haben  werden,  werden  uns  sicher- 
lich genug  zur  Verfügung  stehen,  um  für  jede  Altersstufe  Parallel- 


1)  Vgl  Anhang  U. 

-)  Vgl.  Binet,  36,  S.  163. 

^)  Binet  ließ  fünf  neunjährige  Kinder  zweimal  mit  denselben  Tests 
prüfen;  die  Zwischenzeit  betrug  14  Tage.  Im  Durchschnitt  leisteten  die 
Kinder  bei  der  zweiten  Prüfung  21/2  Tests  mehr,  was  eine  Erhöhung  des  lA. 
um  ^/g  Jahr  bedeuten  würde  (S.  164/5).  —  Bei  längeren  Zwischenräumen  ist, 
wie  Bobertag  gezeigt  hat,  die  in  der  Wiederholung  liegende  Gefahr  nicht  mehr 
so  groß  (s.  oben  S.  47);  immerhin  bleibt  auch  hier  die  Anwendung  der  iden- 
tischen Tests  nur  ein  Notbehelf  und  eine  zweite  und  dritte  Wiederholung  wäre 
wohl  ganz  unmöglich. 
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Serien  zu  schaffen;  einige  Schwierigkeit  wird  es  nur  machen, 
eine  ungefähre  Gleichwertigkeit  der  entsprechenden  Staffeln  zu 
erzielen. 

Noch  eine  andere  Erweiterung  ist  gelegentlich  gewünscht 
worden.  Da  sich  zeigte,  daß  bei  den  jüngeren  Kindern  die  I. -Diffe- 
renzen von  einem  Jahr  zum  andern  außerordentlich  große  sind, 
wurde  das  Bedürfnis  nach  Zwischenstufen  rege,  also  etwa  nach 
besonderen  Serien  für  die  Altersstufen  61/2,  '<^V2,  81/2-  Wie  mir  aber 
scheint,  ist  das  Bedürfnis  auf  anderem  Wege  zu  befriedigen,  näm- 
lich durch  Benutzung  des  IQ.,  der  es  erlaubt,  ohne  besondere 
Halb  Jahrsstaffeln  doch  Bruchteile  von  Jahrgängen  in  Betracht  zu 
ziehen  (s.  unten  S.  73). 

Als  curae  posteriores  dürfen  wir  wohl  endlich  noch  weiter- 
gehende Wünsche  behandeln:  Differenzierung  der  Serien  für 
Kinder  verschiedener  sozialer  Schichten,  für  Kinder  verschiedenen 
Geschlechts,  besondere  sprachlose  Serien  für  die  Prüfung  Taub- 
stummer usw. 

d)  Die  Berechnung  der  Resultanten  werte.  —  Hier  haben 
sich  hauptsächlich  zwei  Mängel  herausgestellt. 

Der  eine  besteht  in  der  Beschränkung  der  Maße  für  lA.  und 
LA.  auf  ganze  Zahlen.  Die  hierfür  nötigen  Abrundungen  müssen 
oft  zu  Gewaltsamkeiten  führen,  welche  eine  exakte  Ausbildung 
der  Methode  unmöglicb  machen. 

Ein  Kind  z.  B.,  dem  bei  der  Prüfung  noch  vier  Monate  an  der 
Vollendung  des  achten  Lebensjahres  fehlen,  muß  notgedrungen  als  „Sjährig" 
gerechnet  werden.  Löst  es  die  Tests  der  7  jährigen  und  noch  zwei  dazu, 
so  erhält  es  doch  nur  als  lA.  7  Jahr.  Demnach  ergibt  sich  ein  IR.  von 
einem  Jahr,  obwohl  in  Wirklichkeit  so  gut  wie  gar  kein  Rückstand  besteht. 

Bobertagi)  suchte  dieser  Schwierigkeit  zu  entgehen, 
indem  er  lediglich  solche  Kinder  zur  Prüfung  auswählte,  die  nur 
um  weniges  (höchstens  2  Monate)  von  ihrem  Geburtstag  entfernt 
waren.  Aber  in  den  meisten  Fällen  hat  man  keine  freie  Wahl;  es 
sind  bestimmte  Kinder  zu  prüfen,  ganz  gleich,  welches  ihr  augen- 
blickliches Alter  ist.  Außerdem  wird  durch  jenen  Ausweg  die 
Schwierigkeit  höchstens  für  das  LA.,  nicht  aber  für  das  lA. 
vermindert;  die  Nichtberücksichtigung  von  2  oder  3  überzähligen 
Tests  bei  diesen  Berechnungen  bleibt  ein  Mißstand. 

Man   wird  daher    die    groben    ganzzahligen  Angaben   (1,   2, 

^)  40,  I  S.  110. 
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3  Jahre  Rückstand),  so  verlockend  ihre  Einfachheit  sein  mag,  ver- 
lassen und  Bruchwerte  einführen  müssen,  wobei  selbstverständlich 
die  erste  Dezimale  genügt.  Beim  lA.  muß  dann  jeder  überschüssige 
Einzeltest  einen  Bruchteil  einer  Jahresstaffel  repräsentieren.  Sind 
z.  B.  von  den  fünf  für  8  jährige  geforderten  Tests  zwei  gelöst,  so 

2 

werden    dem   lA.  -^  zugerechnet  werden ;   das   Kind  in  unserem 

obigen  Beispiel  erhielte  also  das  lA.  7,4.  Eine  solche  Verrech- 
nung der  Einzeltests  wenden  bereits  Terman  und  Childs  an'); 
doch  wird  ihre  Berechnung  dadurch  unübersichtlich,  daß  die  Bruch- 
werte für  die  einzelnen  Jahrgänge  verschieden  sind;  bei  einer 
Staffel   von   insgesamt   sieben   Tests   erhält   jeder   Test   nur   den 

AVert  -=-,  bei  einer  Staffel  von  5  Tests  ~^.    Auch  dieser  Gesichts- 
7'  5 

punkt  empfiehlt  daher  die  oben  angedeutete  Reform,  daß  für  jeden 

Jahrgang   durchweg   5   Tests  bestimmt  werden.    Dann   hat  jeder 

Einzeltest  innerhalb  seines  Jahrgangs  den  Wert  0,2. 

Sind  aber  erst  einmal  die  bequemen  Ganzzahlen  aufgegeben, 
so  fällt  jedes  Bedenken  gegen  die  Einführung  des  Intelligenz- 
quotienten, der  an  die  Stelle  der  2  Bruchwerte  für  LA.  und  lA. 
einen  einzigen  setzt.  Dieser  Quotient  liegt  bei  völlig  normalen 
Kindern  um  1  herum  und  stuft  sich  von  hier  aus  kontinuier- 
lich nach  unten  und  oben  hin  ab.  Die  Stetigkeit  (die  doch  zweifel- 
los einen  Vorzug  gegen  die  frühere  sprunghafte  Verteilung  nach 

lA. 

Jahresgraden  bedeutet)  ist  dadurch  bedingt,  daß  das  Verhältnis  yy 

Avegen  der  nun  dabei  verwandten  Dezimalen  alle  beliebigen  Werte 
annehmen  kann.  So  wird  der  IQ.  nicht  nur  für  die  Prüfung  ab- 
normer Kinder  zu  einem  brauchbaren  methodischen  Hilfsmittel, 
sondern  empfiehlt  sich  auch  für  normale  Individuen;  wir  haben 
hierzu  schon   weiter  oben  (S.  70)   einen  Anwendungsfall  erwähnt. 

Der  andere  Mangel  besteht  in  der  bisherigen  Behandlung  der 
Staffelstreuung  bei  Berechnung  des  lA.  Bekanntlich  sollen  die 
verstreuten  Tests  zu  5  zusammengefaßt  werden,  um  ein  weiteres 
Jahr  dem  lA.  hinzuzufügen;  hierbei  wird  nicht  berücksichtigt, 
aus  welchen  Jahrgängen  die  Tests  stammen.  Nun  vergleiche  man 
einmal  folgende  zwei  (fingierte)  Beispiele: 


■')  64. 
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Kind  A: 
Alle   Tests   bis    6    Jahr   einschließlich    sind   gelöst;   also   Ausgang    der 

Berechnung:  intellektuelles  Niveau 6  Jahi'e 

außerdem  von  der  Staffel     7  Jahr  2  Tests  ^ 

.1      ,,         »  8     ,,      3      „      (  Insgesamt  _  „  ,  , 

»      „        „         9     „      3      „      I    10  Tests  "  ^  "^^^ 


endgültiges  intellektuelles  Niveau       8  Jahi-e 

Kind  B: 
Alle    Tests    bis    6    Jahr   eüischließlich   sind   gelöst;    also   Ausgang    der 

Berechnung:  inteUektueUes  Niveau 6  Jahre 

außerdem  von  der  Staffel     7  Jahr  3  Tests  ^ 

5      .,      I  Insgesamt 
9 


10 


2      ,.      i    lOTests  =2  Jahre 


0 


endgültiges  intellektuelles  Niveau 8  Jjihre 

Die  Grleichsetzung  der  beiden  Kinder  erscheint  in  keiner 
Weise  gerechtfertigt,  da  das  erste  mit  seinen  in  höhere  Alters- 
regionen hineinragenden  Leistungen  entschieden  geistig  höher 
steht.  Will  man  gerecht  sein,  so  muß  man  schwerere  (aus  höheren 
Jahrgängen  stammende)  Tests  bei  der  Konstituierung  eines  niede- 
ren lA.  mit  höheren  Bruchwerten  einsetzen  als  die  normalen  Tests 
des  betreffenden  Alters.  Auch  hierfür  sei  ein  nicht  allzu  ver- 
wickelter Eechnungsmodus  vorgeschlagen,  der  —  ähnlich  wie  der 
IQ.  —  die  Jahrgänge  zueinander  in  Beziehung  setzt:  ein  Test  aus 
einer  höheren  Altersstufe,  der  dazu  dient,  eine  Lücke  in  einer 
niederen  auszufüllen,  werde  nicht  nur  als  ein  Test,  sondern  als 
Quotient  der  beiden  Jahrgänge  gerechnet. 

Für  Kind  A  in  unserem  obigen  Beispiele  würde  sich  demnach  er- 
geben :  Ausgangspunkt  lA.  6  Jahre ;  die  Tests  aus  den  ^der  folgenden 
Jahrgängen  wären  folgendermaßen  zu  zählen: 

Staffel  7  wird  gebildet  diu'ch  2  Tests  aus  dem  Jahrgang  7  (diese  erhalten 
also  jeder  den  Wert  „1  Test")  und  durch  3  Tests  aus  dem  Jahrgang  8  (diese 

sind  je  als  —  Tests  zu  berechnen).    Der  Jahrgang  8  würde  gebildet  werden  durch 

9 
3  Tests  aus  dem  Jahrgang  9  (jeder  =  -^  Test  zu  rechnen)  und  zwei  Tests  aus 

8 

dem  Jahrgang  10  (jeder  als  —  Test  zu  rechnen).  Es  ergibt  sich  also  die  Zusatzsumme: 
o 

2x1=2      Tests 

o  X  -_-  =  o,4       „ 

3  X  1  =  3,4      „ 

2x^=^2,5     „ 
11,3  Tests 


Di6  psychologischen  Methoden  der  Intelligenzpi-üfung.  75 

Da  je  5  Tests  als  eine  Altersstufe  gelten,  so  bedeutet  dieser  Wert  einen 

11  3 

Zusatz  von  — -!— =  2,3  I.-Staffeln;  das  Kind  A  erhält  also  ein  lA.  von  8,3. 

Bei  Kind  B  ergäbe  sich:  die  2  Tests  aus  der  Staffel  9  dienen  zur  Auffüllung 

9 
der  Staffel  7.   erhalten  also  je  den  Wert  -— ,   die  übrigen  3  Tests  von  7  Jahren 

sowie  die  5  Tests  von  8  Jahren  gelten  für  ihre  Staffel,  rechnen  also  =  1. 

3x1=3     Tests 

2x^  =  2,6      „ 

5x  1  =5 


10,6  Tests 
10,6  Tests  bedeuten  ein  Zusatzalter  von  2,1  Jahr;  Kind  B  erhält  also  das 
lA.   8,1  und  die   Rückständigkeit  gegen  Kind  A  ist  nun   zahlenmäßig  zum 
Ausdruck   gebracht. 


III.  Schätzung  und  Prüfung  feinerer  Intelligenzabstufungen. 

(Mit  Hilfe  der  ßangmethode.) 

1.  Die  Aufgabe. 

Die  Unterschiede  im  Intelligenzgrade,  welche  uus  die  Staffel- 
methode liefert,  sind  verhältnismäßig  grob;  innerhalb  einer  und 
derselben  Intelligenzaltersstufe  sind  noch  sehr  viel  feinere  Ab- 
stufungen möglich,  die  jener  Prüfung  entgehen.  Aber  oft  genug 
wird  es  gerade  auf  diese  ankommen,  nämlich  überall  da,  wo 
man  es  mit  Angehörigen  einer  relativ  homogenen  Gruppe  zu 
tun  hat.  Wenn  man  z.  B.  die  Schüler  einer  Schulklasse  vergleicht, 
die  ungefähr  dasselbe  Alter  und  übereinstimmenden  Grad  der  Schul- 
bildung haben,  so  fallen  sie  zum  größten  Teil  in  dieselbe  I.-Staffel 
nach  BS.,  bilden  aber  dennoch  innerhalb  dieser  eine  reiche  Stufen- 
leiter von  I.-Graden.  Die  Frage,  welche  Stellung  ein  Schüler 
seiner  I.  nach  unter  seinen  Alters-  und  Klassengenossen 
einnimmt,  muß  daher  mit  anderen  Methoden  beantwortet  werden, 
welche  eine  Rangordnung  der  beteiligten  Individuen  zu  schaffen 
suchen. 

Rangordnungen  der  Schüler  einer  Klasse  sind  in  der  ver- 
schiedensten Weise  herstellbar.  Da  gibt  es  zunächst  die  eigentlich 
schulischen  Rangordnungen,  die  auf  Grund  der  Schulleistungen 
gebildet  werden.  So  numeriert  man  die  Schüler  nach  dem  Ausfall 
eines  Extemporales;  der  Fachlehrer  rangiert  sie  zum  Quartals- 
sclduß  nach  der  Gesamtheit  der  Leistimgen  in  seinem  Fach;  end- 
lich   werden   alle    diese    Fachrangierungen    verbunden    zu     einer 


76  "^^  Stei-n. 

Zeugnisrangordnung,  in  der  jeder  Schüler  seinen  „Klassenplatz" 
erhält. 

Da  diese  Rangordnungen  stets  zur  Verfügung  stehen,  lag  es 
nahe,  sie  für  unser  Problem  zu  verwerten.  Dies  ist  denn  in  den 
ersten  Stadien  der  I. -Forschung  auch  mehrfach  geschehen.  So  hat 
z.  B.  Ebbinghaus  (5)  seine  Prüflinge  nach  dem  Klassenplatz  in 
drei  Drittel  geteilt,  um  festzustellen,  ob  die  verschiedenen  Gruppen 
verschieden  gut  auf  die  Ergänzungstests  reagierten. '  Andere  For- 
scher ließen  sich  vom  Lehi'er  eine  Anzahl  von  „guten"  und 
„schlechten"  Schülern  auswählen,  um  deren  experimentelles  Ver- 
halten miteinander  zu  vergleichen. 

Allein  so  bequem  diese  stets  vorliegende  Klassifikation  sein 
mag,  so  wenig  zulänglich  ist  sie  für  unsere  Zwecke.  Denn  die 
stillschweigende  Voraussetzung,  die  solchen  Verwendungen  des 
Klassenplatzes  zugrunde  liegt:  daß  die  Schulleistungsfähigkeit  ein 
durchaus  korrektes  Abbild  der  I.  sei,  ist  ungerechtfertigt.  Dies 
haben  uns  bereits  die  Ergebnisse  nach  der  BS. -Methode  gezeigt 
(s.  S.  40),  und  weitere  statistische  Befunde  werden  es  bestätigen; 
aber  auch  jeder  Schulmann  weiß  es,  der  einigermaßen  mit 
psychologischem  Blick  begabt  ist. 

Wii'  brauchen  also  eine  Rangordnung,  welche  sich  direkt  auf 
den  I.-Grad  der  Schüler  bezieht. 

Eine  solche  ist  im  gewöhnlichen  Schulbetriebe  nicht  vor- 
handen und  muß  daher  erst  ad  hoc  hergestellt  werden.  Hierfür 
öffnen  sich  wiederum  zwei  verschiedene  "Wege:  entweder  kann 
der  Lelirer  auf  Grund  der  gesamten  Kenntnis,  die  er  von  den 
Schülern  besitzt,  deren  I.  schätzen  und  hiemach  rangieren  (vgl. 
den  nächsten  Abschnitt);  oder  man  kann  experimentelle  I.- 
Prüfungen anstellen,  deren  Ausfall  die  Ordnung  der  Schüler  in 
eine  Reihe  erlaubt.  So  scheiden  sich  die  I. -Rangordnungen  in  die 
Schätzungs-  und  die  Testrangordnungen. 

Uns  kommt  es  letzten  Endes  auf  die  zweiten  an:  Ist  es  mög- 
lich, auf  Grund  einer  kurzen  Prüfung  mit  einer  Reihe 
von  Tests  eine  Gradabstufung  der  Prüflinge  herzustellen, 
die  ihrer  wirklichen  I.-Verschiedenheit  entspricht,  so 
daß  durch  den  Rangplatz,  den  der  einzelne  erhält,  dessen 
I.-Grad  innerhalb  der  Gruppe  zutreffend  charakteri- 
siert ist? 

Eine  Rangordnung  auf  Grund  eines  Tests  oder  einer  Testserie 
zu  gewinnen,  ist  nicht  schwer.    Die  Binettests  freilich,  die  meist 
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nur  eine  Wahl  zwischen  den  Wertungen  richtig  oder  falsch 
zulassen,  sind  nicht  dazu  geeignet,  wohl  aber  alle  jene  Tests, 
die  eine  meßbare  Leistung  erzeugen,  sei  es,  daß  das  Quantum  des 
in  bestimmter  Zeit  Geleisteten,  sei  es,  daß  die  Qualität  (durch  die 
Fehlerzahl)  gemessen  wird.  Jeder  solche  Test  schafft  eine  Ean- 
gierung;  nur  steht  es  dahin,  wieviel  diese  etwa  für  die  I.  der 
Prüflinge  besagt. 

So  wird  denn  auch  hier  ein  Eichungsmittel  erforderlich:  und 
dies  besteht  in  der  Yergleichung  mehrerer,  an  denselben  Indi- 
viduen gefundenen  Rangordnungen  untereinander  mittels  der  Me- 
thode der  Korrelation. 

Die  Methodik  der  Korr. -Rechnung  kann  hier  natürlich  nicht 
entwickelt  werden  i).  Es  sei  nur  soviel  erwähnt :  Korr.  =  1  bedeutet : 
zwischen  den  beiden  Rangordnungen  (oder  Gruppenbildungen)  be- 
steht völlige  Übereinstimmung.  Korr.  =  0  bedeutet :  es  besteht  gar 
keine  Beziehung.  Die  Höhe  des  Dezimalbruchs  zwischen  0  und  1 
gibt  also  die  Stärke  der  Übereinstimmung  an.  Der  wahrscheinliche 
Fehler  (w.  F.)  ist  ein  Maß  der  Zuverlässigkeit;  nur  wenn  der  Korr. - 
Wert  mindestens  das  Dreifache  des  w.  F.  beträgt,  ist  ihm  eine 
reelle  Bedeutung  beizumessen.  Im  einzelnen  zeigen  die  Rechen- 
methoden, nach  denen  die  Korr. -Koeffizienten  von  verschiedenen 
Forschern  bestimmt  werden,  vielfache  Abweichungen.  Ein  Beispiel 
für  die  von  mir  benutzte  einfachste  Art  der  Berechnung  der  Rang- 
Korr.  enthält  der  Anhang. 

Alle  bisher  genannten  Rangordnungen  können  miteinander  in 
Korr.  gebracht  werden;  von  diesen  möglichen  Korrelationen  kom- 
men für  unser  Problem  in  Betracht:  Die  Test/Testkorrelation,  die 
Schätzungs/Schulleistungs-Korr.,  die  Test/Schätzungs-Korr. 

Test/Test-Korrelationen  sind  namentlich  von  Spear- 
man  bearbeitet  worden  (77,  79,  80).  Wenn  die  Schüler  einer 
Klasse  in  mehreren  verschiedenartigen  Tests  geprüft  sind  und  die 
hiernach  gebildeten  Rangordnungen  untereinander  hohe  Korrelation 
zeigen,  so  ist  dies,  wie  Spearman  meint,  ein  Zeichen,  daß  die 
Leistungsfähigkeit  in  den  Tests  von  einem  gemeinsamen  Faktor 
(Spearman  gebraucht  dafür  die  Ausdrücke  „general  intelligence", 
„general  ability")  abhängt.  Dieser  bewirkt,  daß  der  Schüler  A 
sowohl  bei  der  Unterscheidung  von  Linienlängen,  wie  beim  Be- 


^)  Gesamtdarstellungen  dieser  Methodik  bei  Betz  (70)  und  bei  Stern  (1), 
Kap.  XIX  und  XX. 
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halten  sinnloser  Silben  usw.  hoch,  der  Schüler  Z  sowohl  in  der 
einen  Avie  in  der  anderen  Funktion  tief  rangiert.  Denn  wenn 
Spezialbegabungeu  den  Ausschlag  gäben,  würde  ein  und  derselbe 
Schüler  in  den  verschiedenen  Tests  stark  abweichende  Rangplätze 
einnehmen  können.  Spearman  fand  nun  in  der  Tat  zum  Teil  über- 
raschend hohe  Korr. ;  deshalb  hält  er  es  für  erwiesen,  daß  eine 
solche  allgemeine  I.  tatsächlich  besteht,  und  daß  ihr  Grad  durch. 
Tests,  die  untereinander  stark  korrelieren,  experimentell  prüf- 
bar  ist. 

Dem  ersten  Teil  dieses  Schlusses  kann  man  zustimmen.  Wir 
haben  an  früheren  Stellen  schon  mehrfach  auf  den  „allgemeinen" 
und  ,, formalen"  Charakter  der  I.  hingewiesen,  der  sich  über 
Leistungsgebiete  sehr  verschiedenen  Inhalts  erstreckt.  Freilich 
auch  dies  mußte  betont  werden,  daß  die  Gleichmäßigkeit  dieser 
Wirkung  immer  nur  eine  annähernde  ist,  daß  es  auch  innerhalb 
der  „allgemeinen  I."  jedes  Menschen  besonders  betonte  Gebiete 
und  besonders  schwache  Punkte  gibt,  und  daß  hier  nicht  die  t^'ber- 
e instimm ung  der  Leistungen,  sondern  deren  gegenseitiger  Aus- 
gleich („Kompensation")  ein  zutreffendes  Bild  der  Gesamtintelli- 
genz des  Individuums  zu  geben  verspricht. 

Damit  aber  wird  der  Wert  der  Spearm ansehen  Methode  für 
Zwecke  der  I. -Prüfung  zweifelhaft.  Wählen  wir  4  oder  5  sehr 
stark  korrelierende  Tests  aus,  um  ihren  Gesamteffekt  als  I.-Maß 
zu  benutzen,  so  ist  die  Gefahi*  vorhanden,  daß  wir  damit  nur  eine 
eng  begrenzte  Seite  der  I.  prüfen,  andere  kompensatorisch  wichtige 
Seiten  aber  unter  den  Tisch  fallen  lassen.  Stellen  wir  dagegen 
mit  Rücksicht  auf  die  Kompensation  Tests  von  nur  mittlerer  Korr. 
zusammen,  so  fehlt  jede  Kontrolle,  welche  Verbindung  von  Tests 
nun  wirklich  denjenigen  gegenseitigen  Ausgleich  erzielt,  puf  Grund 
dessen  im  ganzen  ein  richtiger  Maßwert  für  die  I.  heraus- 
springt. 

Man  wird  zwar  zum  ersten  Punkt  einwenden:  Stark  korre- 
lierende Tests  kann  man  aus  so  verschiedenen  psychischen  Gebieten 
wählen,  daß  die  Gefahr,  nur  eng  begrenzte  Seiten  der  I.  zu  prüfen, 
vermieden  wird.  Demgegenüber  aber  muß  ein  bisher  nicht  ge- 
nügend beachteter  Gesichtspunkt  hervorgehoben  werden.  Alle 
Testprüfungen,  mögen  sie  auch  die  verschiedensten  Gebiete  be- 
rühren, liaben  das  Gemeinsame,  experimentelle  Verfahrungsweisen 
zu  sein,  und  setzen  damit  die  Prüflinge  unter  die  gleichmäßige 
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psychische  Bedin^ng,  daß  sie  Versuchspersonen  sind.  Hierzu 
gehören  aber  nicht  nur  ganz  bestimmte  Einstellungen  der  Auf- 
merksamkeit, der  Stimmung  usw.,  sondern  vor  allem  der  Habitus 
des  bloßen  Eeagierens,  des  Eingehens  auf  die  von  außen  ge- 
stellten Aufgaben  in  einem  gegebenen  Augenblick.  Damit  bleibt 
aber  die  spontane  Intelligenz  vom  Experiment  ausgeschlossen, 
jene  L,  die  sich  von  selber  Probleme  stellt,  die  über  gegebenes 
hinaus  selbständig  weiter  denkt,  die  den  Erklärungen  durch  Fragen 
zuvorkommt,  die  in  den  realen  Situationen  des  Lebens  schnell  die 
richtigste  Verhaltungsweise  ausfindig  macht.  Und  wir  haben  zu- 
nächst gar  kein  Urteil  darüber,  ob  wir  aus  der  —  noch  so  viel- 
seitig geprüften  —  reaktiven  I.  auf  diese  spontane  scliließen 
können.  Möglich,  daß  gewisse  Tests  oder  Testkombinationen  eine 
ziemlich  hohe  Korr.  mit  der  spontanen  I.  haben,  aus  den  Experi- 
menten selbst  wird  dies  nicht  festzustellen  sein. 

Die  bloße  Vergleichung  der  Tests  unter  sich  führt  also  weder 
zu  einer  klaren  Einsicht  über  die  nötigen  Kompensationen,  noch 
zu  einem  Urteil  über  den  symptomatischen  Wert  der  Prüfung; 
wir  müssen  das  Eichungsmittel  für  die  Tests  vielmehr 
bei  einem  außerhalb  des  Experiments  gelegenen  Kri- 
terium suchen;  als  solches  bietet  sich  die  vom  Lehrer  vor- 
genommene Einschätzung  der  Schüler  dax. 

Damit  aber  gewinnt  eben  diese  I. -Schätzung  durch  den  Lehrer 
eine  ganz  selbständige  methodologische  Bedeutung;  denn  sie  darf 
doch  erst  dann  anderen  (nämlich  den  experimentellen)  Rang- 
ordnungen als  Vergleichsmaßstab  untergelegt  werden,  wenn  wir 
uns  über  ihre  eigene  Struktur  und  Zuverlässigkeit  klar  sind. 
Hierzu  dienen  zwei  Hilfsmittel:  die  Analyse  des  Verhaltens  des 
Lehrers,  wenn  er  die  I.  seiner  Schüler  schätzt,  und  die  objektive 
Feststellung,  wieweit  seine  Schätzung  von  der  ihm  bekannten 
schulischen  Eangordnung  der  Kinder,  also  dem  Klassenplatz  oder 
der  Prüfungsnote,  abhängig  ist. 

Erst  wenn  hiemach  feststeht,  ob  und  unter  welchen  Kautelen 
die  I. -Schätzung  ein  brauchbares  Kontrollmittel  ist,  kann  die  eigent- 
lich experimentelle  Aufgabe  angegriffen  werden:  diejenige  Test- 
kombination zu  finden,  welche  mit  einer  zuverlässigen  Schätzungs- 
reihe in  hohem  Grade  und  mit  großer  Regelmäßigkeit  korreliert. 
Damit  ist  das  Thema  für  die  drei  folgenden  Abschnitte  gegeben. 
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2.  Die  Schätzung  der  Scliülerintelligeiiz  durch  den  Lehrer. 

Die  Frage,  ob  ein  Lehrer  imstande  ist,  den  I.-Grad  seiner 
Schüler  schätzungsweise  zu  beurteilen,  hat  auch  außerhalb  unseres 
engeren  Problems  keine  geringe  Bedeutung.  Denn  es  ist  praktisch 
zweifellos  von  hohem  Wert,  wenn  der  Lehrer,  der  sonst  gewohnt 
ist,  die  Schüler  vornehmlich  nach  dem  äui^erlich  hervortretenden 
Leistungseffekt  zu  beurteilen,  sich  einmal  klar  darüber  zu  werden 
sucht,  ob  und  in  welchem  Maße  hieran  eine  bestimmte  Fähigkeit, 
nämlich  die  allgemeine  Intelligenz,  beteiligt  sei.  Er  wird  hier- 
dizrch  gezwungen,  seine  Schüler  genauer  zu  studieren  und  ilire 
individuelle  Beschaffenheit  zu  analysieren,  und  kommt  vielleicht 
auf  diesem  Wege  auch  zu  einer  richtigeren  Würdigung  ihrer 
Leistungen,  zu  Beschlüssen  über  Umschulung,  zu  Ratschlägen  für 
die  Berufswahl. 

Ton  der  L -Prüfung  unterscheidet  sich  die  I. -Schätzung  zu 
ilu-em  Yorteil  dadurch,  daß  sie  sich  auf  langer  und  vielseitiger 
Bekanntschaft  mit  dem  Schüler  aufbaut.  Der  Lehrer  hat  Monate 
hindurch  das  Verhalten  eines  Schülers  beobachtet  bei  mündlichen 
und  schriftlichen  Aufgaben  verschiedener  Fächer,  sein  Fragen  und 
Antworten,  seine  Anteilnahme  oder  Gleichgültigkeit  bei  Behandlung 
mannigfacher  Themen,  die  Selbständigkeit  oder  Anlehnungs- 
bedürftigkeit beim  Arbeiten,  ferner  sein  Benehmen  im  Verkehr 
mit  Kameraden,  beim  Spiel  auf  dem  Schulhofe,  bei  Ausflügen  usw. 
So  besitzt  er  natürlich  eine  ungleich  breitere  Grundlage  für 
ein  Urteil  über  die  I.  des  Schülers  als  der  Experimentator,  der 
lediglich  über  eine  halbstündige  Beschäftigung  mit  dem  Kinde  ver- 
fügt und  dessen  Verhalten  gegenüber  einer  kleinen  Anzahl  von 
Tests  registriert  hat.  Aber  dem  stehen  doch  auch  große  Nachteile 
gegenüber.  Der  Lehrer  gibt  sich  meist  keine  Rechenschaft, 
auf  welche  beobachteten  Einzeltatsachen  sein  Urteil  sich  stützt; 
die  Symptome,  die  ihn  bei  seinem  Urteil  bestimmen,  sind  in  ihi-er 
wirklichen  Bedeutsamkeit  nicht  kontrollierbar;  beim  Vergleich  der 
Intelligenz  mehrerer  Schüler  werden  auch  nicht  durchgängig  ver- 
gleichbare Tatsachen  zugrunde  gelegt;  endlich  wird  er  sich  oft 
gar  nicht  klar,  was  er  denn  unter  „Intelligenz"  zu  verstehen  und 
zu  beurteilen  habe. 

Schon  diese  Erwägungen  zeigen,  daß  eine  ISch.  keineswegs 
eine  leichte  Sache  ist,  die  von  jedem  Lehrer  mit  Selbstverständlich- 
keit  zu   verlano-en   wäre.    Es   2:ilt  hier   zwischen   zwei  entgegen- 
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gesetzten  Fehlern  die  richtige  Mitte  zu  finden:  auf  der  einen  Seite 
droht  die  Gefahr,  daß  der  Lehrer  von  dem  pädagogischen  Usus, 
die  Schüler  nach  den  Schulleistungen  zu  beurteilen,  auch  bei  der 
ISch.  nicht  loskommen  kann;  es  wird  dann  die  I. -Rangordnung  ein 
nur  in  wenigen  Punkten  korrigiertes  Abbild  der  Klassenrang- 
ordnung sein.  Sucht  er  aber  diese  Anlehnung  zu  vermeiden,  so 
ist  die  andere  Gefahr  vorhanden,  daß  er  blind  darauf  losrät,  und 
daß  die  so  zustande  kommende  Rangordnung  ein  reines  Zufalls- 
produkt wird. 

Man  sieht:  die  ISch.  durch  den  Lehrer  liefert  nicht  nur  Bei- 
träge zur  Psychologie  der  Schüler,  sondern  auch  solche  zur 
Psychologie  der  Lehrer.  Ihre  Fähigkeit  zu  jener  Urteilsfällung 
wird  sehr  verschieden  sein,  und  es  ergibt  sich  für  wissenschaft- 
liche Untersuchungen  die  methodische  Forderung,  daß  man  nicht 
jede  beliebige  ISch.  jedes  beliebigen  Lehrers  als  Vergleichsmaterial 
für  Tests  benutzen  kann,  sondern  daß  man  sich  für  diese 
Zwecke  geeignete,  psychologisch  besonders  geschulte 
und  befähigte  Lehrer  aussuchen,  und  sie  über  den  Sinn 
der  Aufgabe  besonders  instruieren  müsse. 

Eine  ebenso  ergötzliche  wie  lehrreiche  Enquete  hat  nach 
dieser  Richtung  hin  Binet  angestellt  (36;  71). 

Er  richtete  eine  Umfrage  an  zahlreiche  Volksschullehrer  mit  der  Bitte 
um  Angabe:  1.  in  welchem  Maße  sie  glauben,  bei  der  Beurteilung  der  In- 
telligenz ihrer  Schüler  Irrtümern  unterworfen  zu  sein,  2.  welches  Verfahren 
sie  einschlügen,  um  zu  einer  exakten  I.-Sch.  zu  gelangen;  und  auch  B. 
bemerkte  bald,  „daß  er  damit  ein  treffliches  Mittel  gefunden  habe  zur  Klassi- 
fikation der  Intelhgenz  der  Lehrer". 

Die  erste  Frage  war  ziemlich  ungeschickt  gestellt;  sie  zeigte  nur,  daß 
es  Optimisten  gab,  die  sich  so  gut  wie  noch  nie  über  die  I.  ihrer  Schüler 
getäuscht  zu  haben  glaubten,  während  andere  resigniert  gestanden,  daß  unter 
je  drei  Urteilen  wohl  ein  falsches  sein  könne.  Im  übrigen  bot  die  Frage 
wenig  Ergebnisse. 

Viel  ergiebiger  waren  die  Antworten  auf  die  zweite  Frage.  Schon  die 
Auffassungen  des  Begriffs  der  Intelligenz  zeigten  die  größte  Mannigfaltig- 
keit. Von  der  schulmeisterlichen  Engherzigkeit,  welche  in  der  I.  lediglich 
die  Fähigkeit  sieht,  sich  Kenntnisse  zu  erwerben,  bis  zu  der  feinen  Er- 
klärung einer  Lehrerin:  „L'intelligence  ne  sert  pas  seulement  ä  apprendre, 
eile  sert  surtout  ä  ,faire  sa  vie"'  —  begegnete  man  allen  möglichen  De- 
finitionsversuchen. Und  nun  die  Symptome,  nach  welchen  die  Lehrer  ihre 
Schätzungen  vollziehen!  Da  wird  darauf  hingewiesen,  daß  man  der  Erblich- 
keit nachgehen  müsse,  da  bei  Bändern  intelligenter  Eltern  höhere  Intelligenz 
zu  erwarten  sei.  Empfohlen  wird  die  Berücksichtigung  des  Gesichtsausdrucks; 
die  lebhafte,  offene  bewegliche  Physiognomie  unterscheide    das  intelligentere 
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Kind  deutlich  vom  geistig  trägen  schwerfälligen  Kinde.  Einige  betonen  die 
Beobachtung  beim  freien  Spiel;  Kinder,  die  hier  Initiative  und  Produktivität 
zeigen,  seien  intelligent.  Der  Hauptwert  wird  aber  natürlicherweise  gelegt 
auf  das  Verhalten  des  Kindes  beim  Unterricht.  Hierbei  wird  —  mit  mehr 
oder  weniger  Glück  —  der  Versuch  gemacht,  die  eigentlich  intellektuellen 
Momente  der  Unterrichtsleistungen  von  den  mehr  gedächtnismäßigen  zu 
scheiden:  Schnelligkeit  der  Auffassung,  Fähigkeit,  augewandte  mathematische 
Aufgaben  zu  lösen,  Verständnis  für  geschichtliche  Beweggründe  und  Zu- 
sammenhänge, gute  Orthographie,  ausdruckvolles  Lesen  und  manches  andere 
wird  als  Symptom  genannt,  das  den  Lehrern  zur  ISch.  dient.  Endlich 
kommen  die  Lehrer  auch  von  selbst  auf  die  Testmethode:  sie  richten  an 
die  Schüler  bestimmte,  eigens  hierfür  erdachte  Fragen,  deren  Beantwortung 
ihnen  als  Maßstab  der  I.  dient. 

Bin  et  kritisiert  nun  sehr  fein  alle  diese  Gesichtspunkte,  weist 
die  richtigen  Momente  ebenso  wie  die  Fehlerquellen  auf,  die  in 
ihnen  liegen,  zeigt,  daß  die  ad  hoc  erfundeneu  ,, Intelligenzfragen" 
sehr  viel  weniger  brauchbar  sind,  als  die  in  langjähriger  Experi- 
mentalerfahrung  erprobten  Tests  des  Psychologen,  und  kommt  zu 
dem  Ergebnis,  daß  die  ISch.  des  Lehrers  in  keiner  Weise  geeignet 
sei,  die  exakte  I. -Prüfung  überflüssig  zu  machen.  Freilich  hätte 
er  hier  auch  ruhig  das  Umgekehrte  mehr  betonen  dürfen:  daß  die 
ISch.  Vorzüge  habe,  welche  dem  bloßen  Test  prinzipiell  ver- 
schlossen sind,  und  daß  sie  daher  als  Ergänzung,  zum  Teil  auch 
als  Kontrolle  der  Testergebnisse  unentbehrlich  sei^). 

Wir  stellen  nun  die  Hauptforderungen  zusammen,  die  ein 
Lehrer  bei  der  Vornahme  einer  ISch.  berücksichtigen  muß,  wenn 
diese  zu  wissenschaftlichen  Zwecken  benutzbar  sein  soll. 

Er  fasse  L,  so  wie  wir  sie  zu  Anfang  dieser  Abhandlung 
definierten,  als  „allgemeine  geistige  Anpassungsfähigkeit  an  neue 
Aufgaben  und  Beding-ungen  des  Lebens",  beachte  hierbei  vor 
allem  die  beiden  Merkmale:  ,, allgemein"  und  ,, Anpassung  an 
Neues",  und  hüte  sich,  irgendeine  Spezialbegabung  oder  den 
bloßen  Besitz  von  Kenntnissen  oder  Sprachgewandtheit  mit  I.  zu 
identifizieren.    Wegen   des  allgemeinen   Charakters   der  I.    ist  es 


1)  Die  ganze  Betrachtung  B.s  ist  mehr  feuilletonistisch  gehalten,  aber 
gerade  darum  eines  der  schönsten  Beisjjiele  für  die  Grazie  seines  Stiles  und 
die  bildhafte  Anschaulichkeit  seiner  Sprache.  Es  seien  hier  nur  noch  zwei 
Zitate  gegeben,  die  in  ihrer  knappen  Foi-mulierung  unübersetzbar  sind.  Dort, 
wo  davon  die  Rede  ist,  daß  man  Kenntnisse  so  leicht  für  Intelligenzzeichen 
nehme,  heißt  es:  .,La  memoire  est  la  grande  siraulatrice  de  Tintelligence." 
Und  die  Empfehlung,  daß  die  Kinder  auch  beim  freien  Spiel  zu  beobachten 
seien,  wird  begründet:  „En  classe  ils  sont  denatures  par  la  discipline." 
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nötig,  das  Verhalten  des  Kindes  in  recht  verschiedenen  Situationen 
und  bei  mannigfachen  Aufgaben  in  Betracht  zu  ziehen. 

Nun  gehört  es  aber  zum  "Wesen  der  ISch.,  daß  der  einzeln© 
Schüler  nicht  nur  für  sich  beurteilt,  sondern  mit  den  anderen 
verglichen  und  zu  ihnen  in  eine  bestimmte  Beziehung  der  Gleich- 
heit oder  Verschiedenheit  gesetzt  werde.  Hierfür  gilt  eine  Regel, 
die  trotz  ihres  fundamentalen  Charakters  durchaus  nicht  immer 
beobachtet  worden  ist:  Nur  solche  Schüler  dürfen  ihrer  I. 
nach  in  ein  Rangverhältnis  gebracht  werden,  die  im 
übrigen  unter  genügend  gleichartigen  Bedingungen 
stehen.  Denn  die  feinen  unterschiede  der  I.,  welche  bei  der 
Schätzung  in  Betracht  kommen,  haben  nur  Bedeutung  auf  dem 
gemeinsamen  Untergrunde  einer  sonst  homogenen  Gruppe.  Des- 
halb hat  man  die  ISch.  fast  stets  auf  Schüler  je  einer  Klasse  be- 
schränkt; aber  auch  innerhalb  der  Klasse  müßte  man  noch  für 
Homogenität  sorgen,  nicht  nur  indem  man  offenbar  abnorme 
Schüler  ausschließt,  sondern  indem  man  sich  auf  ein  Alters- 
gebiet bestimmter  Breite  beschränkt.  Wenn  sich  z.  B.  in 
einer  Klasse  des  fünften  Schuljahres,  dem  normalerweise  ein 
Lebensalter  der  Schüler  von  10 — 11  Jahren  entspricht,  13  jährige 
Knaben  befinden,  so  sind  diese  nicht  in  die  I. -Rangordnung  ein- 
zubeziehen :  denn  der  Lehrer  ist  außerstande  festzustellen,  wieviel 
an'' der  bei  ihnen  vorhandenen  I.  dem  höheren  Alter  zuzuschreiben 
ist;  dies  müßte  ja  beim  Vergleich  mit  11jährigen  in  Abzug  ge- 
bracht werden.  Deshalb  siebe  man  jede  Klasse,  innerhalb  deren 
man  eine  ISch.  vornehmen  will.  Es  ist  nicht  möglich,  hierfür  eine 
schematische  Regel  aufzustellen.  Die  Breite  der  Altersunter- 
schiede, die  man  noch  einbeziehen  will,  hängt  von  verschiedenen 
Umständen  ab;  bei  höheren  Jahrgängen  kann  man  einen  größeren 
Altersspielraum  zulassen  als  bei  jüngeren  usw.  Im  allgemeinen 
ergab  sich  bei  meinen  unten  zu  erwähnenden  Berechnungen,  daß 
etwa  20 — 25 o/o  der  Schüler  jeder  Klasse  ausgeschaltet  werden 
mußten. 

Die  Anordnung  der  Schüler  nach  der  I.  kann  entweder  in 
Gruppen  oder  in  einer  Rangreihe  erfolgen.  Die  erste  Form  ist 
für  den  Lehrer  bei  weitem  leichter.  Er  ist  ja  gewöhnt,  fast  aUe 
zu  beurteilenden  Phänomene  mit  Prädikaten  zu  belegen,  wodurch 
dann  vier  bis  sechs  Gruppen  entstehen ;  Ähnliches  läßt  sich  auf  die 
Intelligenz  übertragen,  z.  B.  in  der  Form :  I  sehr  hohe  Intelligenz, 
II   gute,   III  mittlere,  IV  geringe,  V   sehr  schwache  Intelligenz. 


S4  W.  Stern. 

Mit  einer  solchen  Gruppierung  begnügten  sich  z.  B.  Pearson 
und  seine  Schüler,  welche  ISch.  in  ihre  massenstatistischen 
Untersuchungen  an  Schulkindern  einbezogen  (74,  76,  81). 

Mir  erscheint  die  Methode  nicht  sehr  empfehlenswert.  Wenn 
sich  auch  die  Mehi'heit  der  Schüler  ohne  Zwang  einer  der  fünf 
Gruppen  eingliedern  läßt,  so  bleibt  doch  stets  eine  nicht  zu  geringe 
Zahl  übrig,  bei  denen  der  Lehrer  zweifelhaft  ist,  welcher  von 
zwei  benachbarten  Gruppen  er  sie  zuweisen  solle.  i)ie  endliche 
Entscheidung  ist  dann  ein  Willkürakt,  der  bei  mehrfacher  Wieder- 
holung den  ganzen  Wert  der  Einteilung  zerstören  kann.  Wenn  z.  B. 
drei  solcher  zweifelhaften  Schüler  der  Gruppe  11 2jugewiesen  werden, 
ergeben  sich  ganz  andere  Yerteilungsverhältnisse  und  Korre- 
lationen, als  wenn  man  sie  zur  Gruppe  III  geschlagen  hätte,  wozu 
ebensoviel  Recht  vorhanden  wäre.  —  Dazu  kommt,  daß  eine  so 
kleine  Anzahl  von  Gruppen  für  die  wichtigsten  Korr. -Probleme 
überhaupt  nicht  ausreicht.  Viele  Tests  liefern  fein  abgestufte 
Rangordnungen  der  Schüler,  daher  ist  es  zu  wünschen,  daß  auch 
die  ISch.,  mit  denen  sie  in  Beziehung  gesetzt  werden  sollen,  in 
der  Form  einer  Rangordnung  vorliege. 

Die  Durchführung  einer  solchen  schätzungsweisen  Rangierung 
aller  Schüler  bietet  natürlich  manche  Schwierigkeiten ;  viele  halten 
sie  von  vornherein  geradezu  für  unmöglich.  Die  Praxis  hat  aber 
gezeigt,  daß  die  Aufgabe  zu  leisten  ist.  Als  Vorarbeit  kann  ja 
die  eben  besprochene  Gruppenbildung  veranstaltet  werden;  sodann 
aber  müssen  die  Schüler  innerhalb  jeder  Gruppe  noch,  so  weit 
es  angeht,  in  eine  Skala  geordnet  werden.  An  den  Grenzen  der 
Gruppen  aber  heißt  es  dann  aufpassen;  denn  es  hat  sich  oft  ge- 
zeigt, daß  hier  Vertauschungen  stattfinden  müssen  (z.  B.  in  der 
Weise,  daß  ein  ursprünglich  noch  der  Gruppe  II  zugewiesenes 
Kind  hinter  die  ersten  der  Gruppe  III  zugehörigen  Kinder  gesetzt 
werden  muß). 

Man  treibe  aber  andererseits  das  Rangordnungsprinzip  nicht 
so  weit,  daß  man  um  jeden  Preis  jedem  Kind  einen  besonderen  Platz 
zuweisen  wolle.  Oft  genug  wird  man  es,  namentlich  in  der  mittleren 
Region,  als  eine  Willkür  empfinden,  daß  N.  einen  schlechteren 
Platz  als  M.  erhalten  solle,  da  man  zu  keinem  eindeutigen  Urteil 
über  den  verschiedenen  Wert  ihrer  Intelligenzen  gelangt.  Hier  gilt 
die  Regel,  daß  man  gleichwertigen  Individuen  eine  gleiche  Rang- 
nummer verleiht,  die  dem  Durchschnitt  der  auf  sie  kommenden 
Rangplätze    entspricht.     Wenn    z.    B.    4    Individuen,    welche    die 
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Rangplätze  5,  6,  7,  8  einzunehmen  hätten,  gleichwertig  erscheinen, 

so  erhalten  sie  sämtlich  den  Rangplatz       '     "y — ^ — ^=6V2-  Wenn 

dieses  Verfahren  wiederholt  vorgenommen  werden  muß,  so  wird 
ja  dadurch  die  Anzahl  der  Rangverschiedenheiten,  über  die  man 
verfügt,  vermindert;  dieser  Nachteil  wird  aber  mehr  als  ausge- 
glichen durch  den  Vorzug,  daß  Willkürlichkeiten  in  der  Ran- 
gierung veniiieden  sind.  Es  ist  kein  Unglück,  wenn  bei  einer 
Klasse  von  30  Schülern  nur  20  oder  selbst  nur  ein  Dutzend  ver- 
schiedene Rangnummern  der  I.  vorkommen. 

Etwas  ausführlicher  müssen  wir  bei  der  schon  oben  angedeu- 
teten Abhängigkeit  der  geschätzten  Reihe  von  der  Schulrangord- 
nung verweilen.  Diese  Abhängigkeit  wird  um  so  größer  sein,  eine 
je  größere  Rolle  die  Schulrangordnung  im  gewöhnlichen  Klassen- 
betriebe spielt.  Hierin  aber  bestehen  die  größten  Verschieden- 
heiten. Der  früher  ganz  allgemeine  Zustand,  daß  jeder  Schüler 
einen  Klassenplatz  hatte,  der  nun  für  ein  Vierteljahr  seinen  Rang 
unter  den  Mitschülern  bestimmte,  kommt  jetzt  mehr  und  mehr  ab. 
Zum  Teil  begnügt  man  sich  damit,  die  Zensur  mit  einer  Platz- 
angabe zu  versehen,  die  aber  im  übrigen  nicht  mehr  stark  be- 
achtet wird  (z.  B.  „versetzt  als  15.  unter  27");  zum  Teil  fällt 
auch  dies  weg,  so  daß  überhaupt  keine  feststehende  Schulrang- 
ordnung vorhanden  ist.  Wünschenswert  ist  es  natürlich  für  die 
ISch.,  daß  sich  der  Lehrer  selbst  dort,  wo  eine  Schulrangordnung 
besteht,  möglichst  von  ihr  unabhängig  macht.  Ein  Verfahren,  das 
hierbei  sehr  oft  geübt  wurde  (weil  es  das  bequemste  ist),  ist  daher 
völlig  zu  verwerfen:  daß  man  die  Schulrangordnung  zugrunde 
lege  und  nur  diejenigen  Kinder  anders  rangiere,  bei  denen  der 
Rangplatz  durch  besondere  Umstände  (Krankheit,  Umschulung, 
offenbare  Faulheit  usw.)  verschoben  ist.  So  verfulir  z.  B.  Burt. 
Diese  „korrigierte  Schulrangordnung"  ist  ja  zweifellos  für  psycho- 
logisch i  Zwecke  besser  als  die  unkorrigierte,  sie  stellt  aber  noch 
durchaus  nicht  eine  richtige  I. -Reihe  dar. 

Um  diese  möglichst  voraussetzungslos  zu  bilden,  sei  folgendes 
Verfahren  empfohlen.  Man  schreibe  die  Namen  der  zu  rangieren- 
den Schüler  auf  lauter  einzelne  Kartonblätter,  die  zunächst  alpha- 
betisch geordnet  werden.  Nun  erst  beginne  man  die  Verteilung 
der  Blätter  auf  verschiedene  Intelligenzgruppen,  endlich  suche 
man  innerhalb  jeder  Gruppe  Rangplätze  herzustellen.  Die  so  ge- 
wonnene Reihe  mit  den  dazugehörigen  Nmnmeni  wird  dann  notiert. 
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Sehr  wertvoll  ist  es,  nach  einem  gewissen  Zwischenraum  (etwa 
3 — 4  Wochenj  die  ganze  Rangierung  noch  einmal  von  vorn  zu 
beginnen,  ohne  Benutzung  der  zuerst  gewonnenen  Reihe.  Der  Grad 
der  Übereinstimmung  dieser  beiden  Schätzungen  ist  nach  der 
Korrelationsmethode  zu  bestimmen ;  nur  wenn  der  Zuverlässigkeits- 
wert hoch  ist  (d.  h.  die  beiden  Reihen  sehr  ähnlich  sind),  dürfen 
sie  weiteren  Untersuchungen  zugrunde  gelegt  werden.  In  diesem 
Falle  bildet  man  am  besten  aus  den  beiden  Schätzungen  eine  amal- 
gamierte  Schätzungsreihe,  indem  man  für  jeden  Schüler  aus  den 
beiden  Rangplätzen,  die  er  erhalten  hat,  das  Mittel  nimmt  und 
aus  diesen   Mitteln  eine  neue  Rangordnung  herstellt. 

Bedeutende  Verschiedenheit  wird  die  Methodik  der  ISch.  bei 
ihrer  Anwendung  in  Volks-  und  in  höheren  Schulen  zeigen. 

Der  Volksschullehrer  hat  den  außerordentlichen  Vorteil, 
daß  er  meist  der  einzige  Lehrer  der  Klasse  ist,  und  daher  das 
Verhalten  der  Kinder  in  größter  Vielseitigkeit:  in  technischen 
und  theoretischen  Fächern,  beim  Spiel  und  bei  der  Arbeit,  be- 
obachten kann.  Aber  gerade  diese  Gesamtkenntnis  macht  ihn  auch 
in  gewissem  Sinne  unfrei  bei  der  Schätzung.  Denn  seine  Kenntnis 
erstreckt  sich  ja  ebenso  umfassend  auf  die  Schulleistungen;  die 
ganze  Zensur  jedes  Schülers,  die  Feststellung  des  Klassenplatzes 
ist  das  alleinige  Werk  des  einen  Lehrers  —  und  es  ist  psycho 
logisch  sehr  verständlich,  daß  er  von  diesem  selbst  erarbeiteten 
Urteil  nicht  so  leicht  loskommt,  auch  wenn  es  sich  um  die  so 
ganz  andere  Aufgabe  der  ISch.  handelt. 

Anders  der  Lehrer  an  der  höheren  Schule.  Er  unterrichtet 
stets  nui-  in  einigen  Fächern  und  lernt  dadurch  die  Schüler  nur 
einseitig  kennen.  Das  erschwert  gewiß  die  ISch. ;  namentlich  muß 
sich  der  Fachlehrer  davor  hüten,  eine  Spezialbegabung  oder  Un- 
begabtheit  in  seinem  Fach  als  allgemeine  Intelligenz  Ovler  Un- 
intelligenz  anzusprechen.  Dafür  aber  ist  er  in  seiner  Rangierung 
unbefangener.  Denn  die  Schulrangordnung,  wenn  eine  solche  über- 
haupt besteht,  ist  niemals  sein  eigenes  Werk,  das  autosuggestiv  auf 
ihn  zurückwirken  müßte,  sondern  ist  nur  durch  mechanische  Addi- 
tion aller  Leistungen  zustande  gekommen,  wobei  andere  ihn  nichts 
angehende  Fächer  mitbeteiligt  sind.  Dazu  kommt  der  weitere 
Vorteil,  daß  man  von  den  verschiedenen  an  einer  Klasse  unter- 
richtenden Fachlehrern  ISch.  derselben  Schüler  erlangen  und 
diese  miteinander  vergleichen,  eventuell  auch  zu  einer  Resultanten- 
reihe verschmelzen  kann.    Natürlich  dürfen  zu  einer  solchen  Ver- 
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gleichung-  nur  diejenigen  Lehrer  zugezogen  werden,  welche  auf 
Grund  der  zu  erteilenden  Unterrichtsstunden  eine  einigermaßen 
genaue  Kenntnis  der  Schüler  haben  können  (also  nicht  etwa  ein 
Lehrer,  der  die  Klasse  nur  in  einem  kleinen  Nebenfach  unter- 
richtet). 

Selbstverständlich  ist  es,  daß  man  ISch.  erst  dann  von  Lehrern 
verlangen  kann,  wenn  sie  in  der  Klasse  wann  geworden  sind,  also 
nicht  etwa  bald  nach  Beginn  des  Schuljahres.  Solche  Lehrer, 
welche  mit  einer  Klasse  mitgegangen  sind,  und  die  Schüler  daher 
länger  als  ein  Jahr  kennen,  bieten  besonders  günstige  Bedingungen. 

3.  ISch.  und  Schulleistung. 
Die  vorstehenden  methodischen  Betrachtungen  seien  nun 
durch  eine  Reilie  von  zahlenmäßigen  Ergebnissen  illustriert,  die 
sich  auf  das  Verhältnis  zwischen  ISch.  und  SchuUeistung  beziehen. 
Ich  stütze  mich  hierbei  auf  einige  schon  vorliegende  Publikationen 
englischen  Ursprungs,  sodann  auf  noch  unveröffentlichtes  Ma- 
terial, das  bei  Gelegenheit  von  Arbeiten  des  Breslauer  psycho- 
logischen Seminars  gewonnen  worden  ist. 

Tab.  XV. 


üntersucher     .     .     . 

Burt(72) 

Burt(72) 

Jones 

Gilby  and 

Waite 

AYaite 

1  ^ 

(76) 

Pearson 
(74) 

(81) 

(81) 

13 -e 

Schulgattung    .     .     . 

Volkssch. 

höh.Schule 

Volkssch. 

Volkssch. 

höh.Schule 

höh.Schule 

P     ■ 

X}  der  Schüler  { 

30 

I2V2-I3V2 

13 

12V.2-13V. 

249 

Korrigiert 

1725 

f.  gleiches 

182 
Ä.lter  u.  glei 

238 
che  Klasse 

Im 

Art  der  ISch.  .     .     . 

Eangordnung 

4 1.-Stufen 

5  Intelligenz-Stufen 

0 

• 

zur  Schulrang- 

TCorr 

ordniang    .     . 

— 

— 

— 

0,67 

0,74 

0,63 

0,68 

der 

zu  Schulprüf g. 

0,81 

0,78 

0,70 

0,68 

0,82 

— 

0,76 

ISch. 

zu  anderen  1- 
Sch.  an  den- 

, 

selb.  Schülern 

0,88 

0,91 

— 

— 

— 

— 

0,89 

Die  englischen  Untersuchungen  (Tab.  XV)  haben  die  Schul- 
leistung-en  auf  verschiedene  "Weise  gemessen.  Zum  Teil  benutzte 
man  die  Klassenplätze,  zum  Teil  den  Ausfall  von  Schulprüfungen, 
wie  sie  in  England  in  allen  Klassen  regelmäßig  stattfinden.  Leider 
werden  über  die  spezielleren  methodischen  Maßnahmen  bei  der 
ISch.  nicht  so  genaue  Angaben  gemacht,  daß  wir  uns  über  die 
Sicherheit  der  Ergebnisse  ein  Urteil  erlauben  könnten. 

Es  finden  sich  durchweg  deutliche,  zum  Teil  hohe  Korr.,  und 
zwar    merklich    höhere    zwischen    I.    und    Prüfungsausfall,    als 
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zwischen  I.  und  Klassenplatz  (0,76  gegen  0,68).  Dies  Eesultat 
ist  nicht  uninteressant.  Soweit  es  nämlich  die  Darstellungen  er- 
sehen lassen,  wurden  die  ISch.  Torgenommen,  ohne  daß  der  Aus- 
fall der  Schulprüfungen  bekannt  gewesen  wäre,  ja  zum  Teil  wohl, 
ehe  diese  stattgefunden  hatten.  Die  Schätzungen  waren  also  nicht 
beeinflußt  von  dem  Prüfuugsrangplatz,  und  die  ziemlich  hohe 
Korr.  wäre  als  echter  Ausdruck  für  den  Grad  der  Übereinstim.- 
mung  zwischen  I.  und  Prüf ungsleistung  anzusehen.  Burt  hat  femer 
ISch.  derselben  Schüler  von  mehreren  Lehrern  bzw.  unbeteiligten 
Mitschülern  vornehmen  lassen ;  die  Korr.  dieser  Schätzungen  unter- 
einander sind  sehr  hoch;  aber  da  alle  Schätzer  von  der  bekannten 
Rangordnung  ausgingen,  die  sie  nur  zu  korrigieren  hatten,  so  ist 
diese  Übereinstimmung  nicht  weiter  verwunderlich  und  wissen- 
schaftlich nicht  brauchbar. 

Bei  Gelegenheit  von  Besprechungen  des  Themas  in  Übungen 
des  Breslauer  psychologischen  Seminars  (W.-S.  1911/12)  stellte 
sich  die  Notwendigkeit  heraus,  durch  eigene  Nachprüfungen  die 
methodischen  Gesichtspunkte  aller  ISch.  zu  klären;  erfreulicher- 
weise waren  zwei  Teilnehmer,  die  selber  in  der  Schulpraxis  stehen, 
bereit,  neues  Material  zu  beschaf f en  i).  Die  so  gewonnenen  Er- 
gebnisse sind  dadurch  schätzenswert,  daß  sie  die  methodischen 
Schwierigkeiten  und  den  Weg  zu  ihrer  Überwindung,  zugleich 
auch  die  notwendige  Yerschiedeuheit  des  Verfahrens  in  höheren 
Schulen  und  in  Volksschulen  sehr  deutlich  daitun. 

Herr  Rektor  Rindfleisch  veranlaß te  die  an  seiner  Knaben- 
volksschule  unterrichtenden  Lehrer,  für  ihre  Klassen  Listen  auf- 
zustellen, welche  einerseits  eine  Rangierung  der  Schüler  nach 
ihren  Leistungen,  andererseits  eine  solche  nach  der  I.  enthielten. 
Nach  diesen  Listen  habe  ich,  soweit  es  anging,  die  Rangkorre- 
lationen berechnet.  Freilich  mußte  eine  ganze  Anzahl  von  Listen 
ausgeschaltet  werden,  teils  weil  sich  die  Lehrer  mit  der  Auf- 
stellung ganz  weniger  I.-Gruppen  begnügt  hatten,  teils  weil  offen- 
bar die  nötigen  methodischen  Vorsichtsmaßregeln  nicht  zur  An- 
wendung gekommen  waren.  So  war  es  manchen  Listen  deutlich 
anzumerken,   daß  zunächst  die  Rangordnung  der  Schulleistungen 


1)  Herrn  Rektor  Rindfleisch  (Li^nitz)  und  Herrn  Oberlehrer 
Dr.  Scheifler  (jetzt  in  Görlitz)  sei  an  dieser  Stelle  für  ihre  Mühewaltung 
und  für  ihre  Freundlichkeit,  mir  das  Material  zur  Verfügung  zu  stellen, 
herzlich  gedankt. 
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aufgestellt  "und  dann  hiernach  die  I.  mit  nur  ganz  wenigen  Korrek- 
turen durchnummeriert  worden  war. 

Die  übrigbleibenden  Listen  erstrecken  sich  aber  doch  über 
sämtliche  Klassengrade;  Tab.  XYI  enthält  die  Hauptdaten.  Man 
ersieht  auch  aus  der  Tabelle,  daß  ich  für  die  Koit. -Berechnung 
stets  eine  Anzahl  von  Schülern  wegließ,  deren  Alter  über  die  zu- 
lässigen Grenzen  hinausging.  Lassen  wir  zunächst  Klasse  Vb  bei- 
seite, so  sind  die  Korr.  durchweg  recht  hoch,  zwischen  0,78  und 
0,97  (Durchschnitt  ohne  Klasse  Vb  =  0,88);  die  größere  Höhe 
gegenüber  den  englischen  Korr.  zwischen  ISch.  und  Klassenplatz 
beruht  zweifellos   darauf,    daß   sich   die   Engländer   mit  wenigen 


Tab.  XVI. 
Volksschule  Liegnitz. 


Anzahl  der 

Klasse 

Schuljahr 

Alter 

Ge- 
prüften 

AVeg- 
gelassenen 

p        wF. 

Via 

1. 

6,3-7,6 

47 

8 

0,85  +  0,05 

VIb 

1. 

6,0-7,1 

37 

16 

0,78  +  0,07 

Vb 

2. 

7,7—8.7 

i   40 
\(34) 

7 
(13) 

0,47  +  0,1 
(0,74  +  0,08) 

IV  a 

3. 

8,3—10,0 

45 

13 

0,87  +  0,05 

lUa 

4. 

9.3—11,6 

43 

11 

0,88  +  0,05 

Hb 

0. 

10,3—12,2 

30 

14 

0,97  +  0,03 

la 

6. 

11,6—13,6 

30 

12 

0,91  +  0,05 

I.-Gruppen  begnügten,  während  hier  Rangierung  gefordert  war; 
diese  schwierige  Aufgabe  bewirkte  eine  etwas  höhere  Abhängig- 
keit von  der  den  Lehrern  bekannten,  von  ihnen  selbst  aufgestellten 
Schulrangordnung.  So  ist  denn  diese  sehr  hohe  Korr.  nicht  der 
adäquate  Ausdruck  für  den  wirklichen  Grad  des  Zusammenhanges 
zwischen  I.  und  Schulleistung.  Dies  wird  durch  eine  feinere  Ana- 
lyse der  Listen  noch  klarer.  Es  gibt  gewisse  Symptome,  an  denen 
man  deutlich  erkennen  kann,  ob  der  Lehrer  auch  nur  den  Ver- 
such gemacht  hat,  sich  von  dem  suggestiven  Einfluß  der  Schul- 
leistungsreihe  freizumachen  oder  nicht;  je  ernsthafter  aber  dieser 
Versuch  ist,  um  so  kleiner  war  die  Korr. 

Bemerkenswert  ist  in  dieser  Hinsicht  die  Klasse  Vb,  deren 
Lehrer  offenbar  mit  großer  Selbständigkeit  und  feinem  psycho- 
logischen Blick  an  die  Arbeit  ging,  die  Nummern  in  der  I. -Reihe 
ohne  Seitenblicke  auf  die  Leistungsreilie  setzte,  und  Fälle  beson- 
derer Diskrepanz  zwischen  Schulleistung  und  I.  durch  kurze 
Bemerkungen  („vom  Lande  zugezogen",  „lange  krank  gewesen", 
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„schlechte  häusliche  Verhältnisse")  verständlich  zu  machen  suchte. 
Das  Ergebnis  war  überraschend :  eine  Korr.  von  nur  0,47 ! 

Dieser  Einzehvert  ist  meines  Erachtens  psychologisch  und 
methodologisch  wichtiger  als  die  viel  höheren  Korr.  der  anderen 
Klassen ;  denn  die  Abweichung  beruht  sicherlich  nicht  auf  einer 
besonderen  Zusammensetzung  der  Klasse  Vb,  sondern  auf  der 
besonderen  Sorgfalt  und  Urteilsfähigkeit  des  schätzenden  Lehrers. 

Ich  stellte  an  der  Klasse  Vb  noch  eine  andere  Berechnung 
an,  indem  ich  diejenigen  6  Schüler  fortließ,  bei  welchen  nach  den 
Anmerkungen  des  Lehrers  besondere  Umstände  vorlagen.  Für  die 
übriggebliebenen  34  stieg  nunmehr  die  Korr.  sofort  auf  0,74, 
näherte  sich  also  schon  sehr  der  unteren  Grenze  der  in  den 
übrigen  Klassen  berechneten  Korr.  Daraus  ergibt  sich  zunächst 
für  diese  Klasse,  vermutlich  aber  auch  als  allgemeiner  Satz:  die 
ursprünglich  niedrige  Korr.  ist  nicht  dadurch  bedingt,  daß  durch- 
gängig dieL-Grade  merklich  von  der  Schultüchtigkeit  differieren, 
sondern  dadurch,  daß  für  eine  Minorität  der  Schüler  ungewöhnlich 
starke  Unstimmigkeiten  zwischen  Begabung  und  Leistung  vor- 
handen sind.  Diese  kleine  Gruppe  verlangt  das  besondere  Augen- 
merk des  Lehrers  und  eine  individualisierende  Behandlung,  denn 
hier  ist  die  Gefahr  am  größten,  daß  die  übliche  Einschätzung 
der  Kinder  nach  den  Schulleistungen  zu  einer  falschen  Beurteilung 
und  Behandlung  führt. 

Aus  höheren  Schulen  verfüge  ich  zurzeit  nur  über  eine 
einzige  Klasse,  aber  die  hier  vorgenommenen  ISch.  haben  ihren 
besonderen  Wert  durch  die  große  Gründlichkeit  und  methodische 
Vorsicht  des  VerfaJirens  und  durch  die  Beteiligung  mehrerer 
Lehrer  an  der  Beurteilung  derselben  Schüler.  Die  von  mir  be- 
rechnete Korr.  enthält  Tab.  XVII.  Ich  verdanke  das  Material 
dem  Ordinarius  der  Klasse. 

Die  Klasse  war  eine  Gymnasial-Untertertia ;  der  Ordinarius 
(Lehrer  A)  war  psychologisch  wohl  geschult  und  beherrschte  als 
Teilnehmer  meines  Seminars  völlig  die  Gesichtspunkte,  die  bei 
einer  I.-Schätzung  in  Betracht  kommen.  Da  er  die  Schüler  bereits 
im  vorhergehenden  Schuljahr  unterrichtet  hatte  und  ihnen  im 
laufenden  Jahre  wöchentlich  10  Stunden  (Latein  und  Französisch) 
gab,  so  durfte  eine  wirklich  genaue  Bekanntschaft  mit  dem  Ma- 
terial vorausgesetzt  werden.  Von  seiner  ISch.  darf  man  daher 
sagen,  daß  sie  unter  besonders  günstigen  Bedingungen  zustande 
gekommen  war.    Daneben  veranlaßte  er  noch  zwei  andere  Lehrer 
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ZU  Schätzungen  derselben  Schüler;  Lehrer  B.  unterrichtete  aller- 
dings in  der  Klasse  nur  zwei  "Wochenstunden  Geschichte,  Lehrer  C. 
vier  Wochenstunden  Religion  und  Deutsch.  Die  Instruktion  lautete 
dahin,  daß  die  Kinder  nicht  etwa  nach  den  besonderen  Leistungen 
in  den  vom  Lehrer  erteilten  Fächern,  sondern  nach  dem  Eindruck 
der  allgemeinen  Intelligenz  zu  beurteilen  wären.  Neben  diesen 
drei  Schätzungsreihen  steht  dann  noch  die  Reihe  der  Klassen- 
plätze zur  Verfügung.  Für  die  Berechnung  schied  ich  wieder  8  zu 
alte  Schüler  aus;  es  blieben  23  übrig  —  eine  Zahl,  die  noch  ge- 
nügt,  um   brauchbare  Korr. -Werte  zu   ermöglichen.    Die   Tabelle 

Tab.  XVn. 
Klasse:  Ulli  eines  Gymnasiums  (7.  Schuljalu-). 
Alter  der  Prüflinge:  13 Va— 14=^2  Jahre. 

Anzahl  der  Prüflinge:  23  (8  zu  alte  Schüler  blieben  unberücksichtigt). 
Anzahl  der  schätzenden  Lehrer:  3  (Lehrer  A  =  Hauptlekrer). 

Korr.  der  ISeh.  zum  Klassenplatz: 

Korr.  (Lehi-er  A  zu  Klassenplatz) 0.43  ±0J3 

V       B    „  „  0,55±0,12 

„       C    „  „  0,33  +  0,14 

„     (Vereinigte  Schätzung  der  Lehrer  B  und  C  zu  Klassenplatz)   .  0,49  +  0,13 

„      A,  B  imd  C  zu  Klassenplatz)  .  0,45  ±  0,13 

Korr.  der  ISch.  unter  sich: 

Korr.  (Lehrer  B  zu  Lehrer  A) ■  .     .  0,69  ±  0,10 

.,       C    „        „       A) 0,65±0,12 

„     (Vereinigte  Schätzung  der  Lehrer  B  und  C  zu  Lehi-er  A) .     .  0,75  ±0,10 

zeigt  nun  auf  den  ersten  Blick,  daß  die  Korr.  zwischen  Intelligenz 
und  Klassenplatz  viel  niedriger  ist  als  in  den  meisten  Klassen  der 
Volksschulen.  Die  besonders  zuverlässige  Schätzung  des  Lehrers  A. 
liefert  Korr.  =  0,43 ;  von  den  beiden  anderen  Lehrern  hat  der  eine 
eine  etwas  höhere,  der  andere  eine  etwas  geringere  Korr.  Ver- 
einen wir  die  Schätzungen  aller  drei  Lehrer  zu  einer  Gesamt- 
schätzungsreihe,  so  hat  diese  zum  Klassenplatz  wieder  die  Korr. 
0,45.  Der  Wert  deckt  sich  fast  genau  mit  dem  jener  einzelnen 
Volksschulklasse  Vb,  die  wir  gesondert  behandelten.  Es  scheint 
also,  daß  bei  besonders  gründlicher  und  vorsichtiger 
Vornahme  der  ISch.  nur  eine  mittlere  Korr.  zur  Schul- 
tüchtigkeit besteht. 

Die  Werte  aller  drei  Oberlehrer  zeigen  zugleich,  daß  es  in  der 
höheren  Schule  dem  einzelnen  Lehrer  viel  leichter  ist,  sich  von  der 
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Klassenrangordnung  zu  emanzipieren,   weil   diese   nicht  ron   ihm 
allein  bestimmt  worden  ist. 

Verstärkt  wird  die  Sicherheit  des  Ergebnisses  durch  die  Korr. 
der  ISch.  der  Lehrer  untereinander.  Hier  bestehen  nämlich  viel 
höhere  Korr. ;  diese  ist  am  höchsten  (0,75),  wenn  man  die  Schätzun- 
gen der  beiden  Nebenlehrer  vereinigt  und  zu  der  besonders  ver- 
trauenerweckenden des  Ordinarius  in  Korr.  setzt,  d.  h.  also:  die 
ISch.,  welche  die  Lehrer  in  völliger  Unabhängigkeit -voneinander 
vornahmen,  haben  eine  weitgehende  Ähnlichkeit  miteinander,  ob- 
gleich doch  die  einzelnen  Lehrer  ihre  Urteile  aus  Beobachtungen 
in  ganz  verschiedenen  Unterrichtsfächern  ableiteten.  Diese  be- 
trächtliche Übereinstimmung  der  Lehrerurteile  über  die 
L  der  Schüler  in  Verbindung  mit  der  ziemlichen  Unab- 
hängigkeit des  Urteils  von  dem  Klassenplatz  scheint 
mir  ein  beachtenswertes  Argument  für  die  wissenschaft- 
liche Brauchbarkeit  der  ISch.-Methode  zu  sein.  Das  Er- 
gebnis im  Vergleich  mit  den  an  der  Volksschule  gemachten  Er- 
fahrungen lehrt  aber  außerdem,  daß  nur  solche  ISch.  brauchbar 
sind,  die  mit  exakter  Methodik  und  psychologischer  Sachkunde 
ausgeführt  worden  sind. 

4.   Testrangordnung  der  Intelligenz. 

Wir  können  nun  wieder  zum  Ausgangspunkt  dieses  gesamten 
Abschnittes,  zur  experimentellen  IP.,  zurückkehren.  Denn  wir 
dürfen  in  der  ISch.  des  Lehrers,  wenn  sie  mit  den  nötigen  Kau- 
telen  vorgenommen  wird,  ein  geeignetes  Kontrollmittel  sehen,  an 
dem  wir  den  "Wert  einer  Testprüfung  messen  können. 

Das  vorliegende  Material  bezüglich  der  Korr.  zwischen  Test- 
und  Schätzungsrangordnung  ist  zwar  recht  dürftig;  dennoch  läßt 
es  schon  deutlich  den  Weg  erkennen,  auf  welchem  größere  Er- 
folge zu  erhoffen  sind.  Auch  hier  kommt  es  nämlich  auf  jenes 
Prinzip  an,  das  wir  für  die  IP.  überhaupt  maßgebend  fanden: 
nicht  irgendein  einzelner  Test,  sondern  eine  geschickte  syste- 
matische Kombination  von  Tests  führt  zu  einer  zuverlässigen 
Graduierung  der  I. 

An  normalen  Schulkindern  stellten  Burt  in  England  und  Eies 
in  Deutschland  einschlägige  Untersuchungen  an.  Burt  verfügt 
nur  über  eine  geringe  Anzahl  von  Personen:  eine  Gruppe  von 
30  Volksschülern  und  eine  andere  von  13  höheren  Schülern;  Ries 
hat  5  Klassen  einer  Volksschule  untersucht.    Die  sehr  viel  um- 
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fassenderen  und  exakteren  Untersuchungen  des  Breslauer  Lehrers 
Hylla  sind  leider  noch  nicht  zum  Abschluß  gediehen. 

Burt  (72)  prüfte  seine  Klassen  mit  12  verschiedenen  Tests. 
Die  für  die  einzelnen  Tests  entstehenden  Rangordnungen  zeigen 
zu  der  Schätzungsrangordnung  sehr  verschiedene  Korr.,  6  Tests 
über  0,50,  6  Tests  unter  0,50.  Zu  den  Tests  mit  höheren  Korr. 
zur  geschätzten  I.  gehören  hauptsächlich  solche,  die  auf  die  Auf- 
merksamkeit, die  motorische  Geschicklichkeit  und  auf  das  Ge- 
dächtnis gehen;  Tabelle  XYIII  erhält  ihre  Liste  mit  den  Korr.-AVerten. 
Dagegen  zeigen  die  Tests  über  Unterschiedsempfindlichkeit  durch- 
weg ganz  geringe  Korr.  zur  L  Das  Ergebnis  ist  deswegen  be- 
merkenswert, weil  noch  immer  bei  manchen  Untersuchern  die 
Neigung  besteht,  sensorische  Tests  zur  IP.  zu  benutzen. 


Tab.  XYin. 
Burt,  Versuche  an  normalen  Kindern. 


Test 


1.  ,.Dotting"  (eine  aus  Punkten  bestehende  Zickzack- 
linie ist  während  gleichmäßigen  A^orbeiziehens 
auszupunktieren) 

2.  „Spot  pattern'-  (eine  Punktfigur  ist  nach  ömahgem 
Zeigen  im  Tachistoskop  nachzuzeichnen)    .     .     . 

3.  „Mirror"  (ein  nur  im  Spiegel  sichtbares  Muster 
mit  markierten  Punkten  ist  auszustechen)     .     . 

4.  „Memory"  (Merkf.  für  konkrete  und  abstrakte 
Worte  und  für  sinnlose  Silben) 

5.  ,.Alphabet"  (Kärtchen  mit  den  Buchstaben  des 
Alphabets  sind  richtig  zu  ordnen) 

6.  „Sorting''  (50  Spielkarten  von  5  verschiedenen 
Farben  sind  in  5  Päckchen  zu  ordnen)     .     .     . 

Resultierende  Rangordnung  aus  allen  6  Tests    .     . 


Korr.  der  Test-Rangordnung 

zur  ISch. 
Volksschule     Höh.  Schule 


0,85 


0,91 


Die  Korr.  sind  bei  Burt  im  allgemeinen  für  die  Volksschule 
etwas  niedriger  als  für  die  höhere.  Bei  der  so  kleinen  Anzahl 
der  Prüflinge  der  zweiten  Gruppe  (13)  ist  aber  den  höheren  Korr. 
kein  besonderer  Wert  beizulegen. 

Riesi)  bedient  sich  zweier  Methoden.  Methode  A  ist  der 
Ranschburgschen  Wortpaarmethode  nachgebildet;  jedes  Wort- 
paar enthielt  je  zwei  kausal  zusammengehörige  Worte  (z.  B. 
„Hunger" — „Ohnmacht") ;  sie  wurden  vorgesprochen  und  ihr  Be- 


1)  78.  —  Vergleiche  auch  das  ausführliche  und  kritische  Referat  über  Ries 
von  Bobertag,  ZAngPs  5,  S.  207. 
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halten  nach  dem  Trefferverfahren  geprüft.  Methode  B  stellte  einen 
Assoziations versuch  dar:  auf  ein  zugerufenes  Wort  sollte  mit  einem 
solchen  reagiert  werden,  dessen  Inhalt  zu  dem  ersten  im  Verhältnis 
der  Wirkung  zur  Ursache  steht.  Durch  die  Benutzung  logischer 
Beziehungen  in  beiden  Methoden  sollte  die  I.  getroffen  werden; 
und  in  der  Tat  ergaben  sich  auch  sehr  hohe  Korr.  zur  geschätzten 
I.  (bei  kleinem  w.  F.),  nämlich  für  Metliode  A  (in  den  ver- 
schiedenen Klassen):  0,59;  0,85;  0,89;  0,86;  0,90;  Methode  B  (in 
den  verschiedenen  Klassen):  0,85;  0,94;  0,86;  0,91. 

Eine  vergleichende  Nachprüfung  mit  der  Ebbinghaus sehen 
Ergänzungsmethode  in  zwei  Klassen  ergab  etwas  kleinere  Korr.- 
Werte. 

Die  Ri esschen  Ergebnisse  zeigen  zweifellos,  daß  die  von  ihm 
vorgeschlagenen  Methoden  einen  Platz  innerhalb  eines  Testsystems 
zur  I. -Rangordnung  beanspruchen  dürfen;  dagegen  darf  man  aus 

Tab.  XIX. 
Eies,  Yei-suche  an  24  Knaben  (Mittelschule,  2.  Klasse,  Alter  12 — 14  Jahre). 
Test  A  Wortpaar-Treffennethode. 
,,     B  Assoziation  einer  Wirkung  zu  einer  gegebenen  Ureache. 
Test  A  zu  Test  B  :  0,61 

Test  A  zu  ISch.      :  0,85 
Test  B  zu  ISch.      :  0,94 


Result.  Eangordnung 

aus  A  und  B  zu  ISch. :  0,98 


den  hohen  Korr.  nicht  etwa  den  Schluß  ziehen,  daß  Methode  A 
oder  Methode  B  für  sich  allein  genügend  wäre,  die  I.  zu  prüfen 
und  zu  rangieren.  Denn  erstens  zeigen  auch  die  Riesschen  Werte 
nicht  die  Regelmäßigkeit,  die  hierfür  nötig  (in  einer  Klasse  hat 
Methode  A  nur  die  Korr.  0,59  zur  geschätzten  I.);  und  es  ist 
sehr  fragiich,  ob  bei  Nachprüfung  an  anderen  Orten  die  hohe  Korr. 
immer  wiederkehren  würde.  Sodann  aber  prüft  jede  der  beiden 
Methoden  nur  eine  Seite  der  I. ;  und  wie  wenig  wir  ein  Recht 
haben,  daraus  auf  die  andere  Seite  zu  schließen,  zeigt  ein  Ver- 
gleich der  beiden  Methoden  untereinander.  Für  eine  Klasse  gibt 
nämlich  Ries  die  Rohtabelle,  aus  der  ich  noch  einige  von  ihm 
nicht  beachtete  Werte  berechnen  konnte  (s.  Tab.  XIX).  Da  ergab 
sich,  daß  die  beiden  Methoden  A  und  B  untereinander  gar  nicht 
so  hoch  korrelierten,  nämlich  nur  mit  0,61 ;  d.  h.  die  I. -Rangierung 
nach  Methode  A  lieferte  zum  Teil  eine  ganz  andere  Platzverteilung 
als  die  nach  Methode  B. 
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Das  Beispiel  ist  nun  aber  vorzüglich  geeignet,  den  Weg  zu 
der  anzuwendenden  Methodik  zu  weisen. 

Was  bedeutet  es,  daß  beide  Tests  so  hoch  mit  der  ISch.,  aber 
viel  weniger  untereinander  korrelieren?  Das  ist  offenbar  nur  dann 
möglich,  wenn  die  Testrangordnungen  von  der  Schätzungsrang- 
ordnung zum  Teil  nach  entgegengesetzten  Seiten  abweichen. 

Ein  Beispiel.  Wenn  ein  Schüler  nach  der  Schätzmig  den  Rang- 
platz 10  erhält,  nach  Test  A  den  Rangplatz  8,  nach  Test  B  den 
Rangplatz  12,  und  wenn  sich  ähnliches  bei  anderen  Individuen 
wiederholt,  so  müssen  sich  die  obigen  Verschiedenheiten  der  Korr. 
ergeben.  Sogleich  aber  sieht  man,  daß  eine  Vereinigung  der  beiden 
Testrangplätze  8  und  12  zu  dem  ,, resultierendem  Testrang- 
platz" 10  führt,  der  nun  mit  dem  Schätzungsrangplatz  überein- 
stimmt: Die  beiden  Tests  kompensieren  sich  also  gegenseitig  und 
bilden  daher  in  ihrer  Vereinigung  ein  L-Maß,  das  dem  der 
Schätzung  weit  näher  kommt,  als  jeder  einzelne  Test  für  sich. 
Psychologisch  ausgedrückt:  die  Tests  treffen  solche  Seiten  der  I., 
die  bei  einem  und  demselben  Individuum  verschieden  stark  aus- 
geprägt sind,  aber  erst  in  ihrer  Gemeinsamkeit  den  I.-Grad  charak- 
terisieren. 

Und  in  der  Tat  ergab  nun  die  Korr.-Berechnung  aus  den  Ri es- 
schen Zahlen,  daß  die  aus  beiden  Tests  gemeinsam  resultierende 
Rangordnung  die  außerordentlich  hohe  Korr.  von  0,98  zur 
ISch.  hat! 

Damit  wird  also  die  gegenseitige  Kompensation  der  Tests,  die 
wir  schon  früher  (S.  16)  als  Erfordernis  hingestellt  hatten,  zum 
Prinzip  der  Testserie;  und  die  Korr.-Methode  gibt  uns  den  zahlen- 
mäßigen Nachweis,  bei  welcher  Zusammenstellung  von  Tests  wir 
der  wirklichen  Kompensation  am  nächsten  kommen.  Wir  müssen 
nämlich  solche  Tests,  die  untereinander  weniger  korrelieren  als 
jeder  mit  der  ISch.,  verbinden;  diejenige  Verbindung,  deren  resul- 
tierende Rangordnung  die  höchste  und  konstanteste  Korr.  zur  ge- 
schätzten I.  zeigt,  ist  das  gesuchte  Prüfungssystem.  Natürlich 
wird  man  sich  hierbei  nicht  auf  zwei  Tests  beschränken,  sondern 
eine  größere  Anzahl  zu  einem  Kompensationssystem  vereinen. 

Dies  war  der  Gedanke,  der  den  Lehrer  Hylla  zu  seinen  be- 
reits erwähnten,  noch  im  Gange  befindlichen  Untersuchungen  ver- 
anlaßte ;  gleichzeitig  war  man  aber  auch  in  England  und  Frankreich 
auf  das  Prinzip  der  Kompensation  gekommen. 

Burt  bildete  nämlich  aus  den  Tests,  welche  bei  seinen  Unter- 
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suchungen  die  höchste  Korr.  zur  geschätzten  I.  gegeben  hatten, 
eine  resultierende  Rangordnung,  deren  Korr.  zur  ISch.  alle  Einzel- 
Korr.  beträchtlich  übertraf  (Tab.  XVIII).  In  der  Volksschule 
schwankten  die  Einzel-Korr.  zwischen  0,52  und  0,76;  die  resul- 
tierende betrug  0,85.  In  der  höheren  Schule  bewegten  sich  die 
Einzel-Korr.  zwischen  0,54  und  0,84;  die  resultierende  aber  erhob 
sich  zu  0,91.    Burt  zieht  hieraus  den  Schluß  (S.  158/59): 


Tab.  XX. 
A.  Descobudres:   Versuche  an  schwachsinnigen  Kindern. 


Tests 


Korrelationen 
der  einzelnen  von  je  5  ver-l von  sämtl.  ver- 
Tests mit     ;  einigt.  Tests     einigt.  Tests 
der  ISch.     i     zur  ISch.  zur  ISch. 


^10. 
11. 

12. 

13. 
14. 

^15. 


Vergleichung  von  Begriffen  .     . 

Eechnen     

Bildbeschi-eibung 

Intelligenzfragen 

Unterscheidung  von  Körnern 
mittels  des  Tastsinns    .... 

Definitionen 

Perlenaufziehen 

Einbildungskraft  (ein  Bild  wird 
gezeigt:  was  sprechen  die  abge- 
bildeten Leute?) 

Geduldspiel  (zerschnittenes  Bild 

zusanunenzusetzen) 

Kenntnis  von  4  Münzen  .  .  . 
Aufmerksamkeit  ^aUe  a  in  einem 

Text  anstreichen) 

Visuelles  Gedächtnis  (5  eben  ge- 
zeigte Objekte  nennen)  ... 
Erkennen  lückenhft.Zeichnimgen 
Auditives  Gedächtnis   (5  "Worte 

wiederholen) 

60  Worte  in   3  Min.   aufzählen 


0,878 
0.868 
0,842 
0,817 

0,812 
0,801 
0.780 


0,761 

0,734 
0,699 

0,671 

0,646 
0,637 

0.539 
0,509 


r    0,91 


r     0,84 


0,73 


0,99 


,,So  sind  wir  mit  Hilfe  von  einem  halben  Dutzend  Tests  im- 
stande, eine  Eeihe  von  Knaben  in  eine  I.-Reihe  zu  ordnen,  welche 
entschieden  genauer  ist,  als  die  durch  Schulpräfungen  zu  er- 
reichende, und  wahrscheinlich  genauer,  als  die  vom  Lehrer  ge- 
gebene, die  auf  mehrjährigem  persönlichen  Verkehr  beruht  und 
mit  ungewöhnlicher  Mühe,  Sorgfalt  und  Gewissenhaftigkeit  her- 
gestellt worden  war." 

Der  Schluß  klingt  ja  reichlich  optimistisch ;  und  das  Menschen- 
material von  im  ganzen  43  Schülern,  über  das  B.  verfügt,  reicht 
im  entferntesten  nicht  dazu  aus,  um  eine  solche  These  zu  formu- 
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lieren;  immerhin  aber  ist  das  Prinzip  so  einleuchtend  und  aus- 
sichtsreich, daß  eine  gründliche  Nachprüfung  mit  exaktester 
Methodik  und  auf  breitester  Grundlage  unumgänglich  ist. 

Auch  bei  schwachsinnigen  Kindern  ist  ein  analoges  Er- 
gebnis gefunden  worden.  Mlle.  Descoeudres  hat  14  Kinder  einer 
Anstalt  mit  15  Tests  geprüft  (73).  Die  Kinder  gehörten  zwar  sehr 
verschiedenen  Altersstufen  an  (von  6 1/2  bis  zu  14  Jahren),  aber 
es  war  doch  möglich,  ihre  I.  nach  dem  Gesamteindruck,  den  sie 
zu  Haus  und  im  Unterricht  machten,  zu  schätzen,  und  sie  hier- 
nach zu  rangieren.  Tab.  XX  enthält  nim  in  der  ersten  Zahlenrubrik 
die  Korr.  der  Einzeltests  zu  der  geschätzten  Rangordnung  nach 
der  Höhe  geordnet;  sie  schwanken  zwischen  0,88  und  0,51.  Die 
Verfasserin  berechnete  aber  auch  die  resultierende  Rangordnung 
aus  allen  Tests  und  fand  hier  die  Korr.  0,99  zur  ISch.,  also  fast 
völlige  Übereinstimmung  beider  Reihen.  Ob  diese  Zahl  ganz 
korrekt  berechnet  ist,  habe  ich  nicht  festgestellt.  Dagegen  habe 
ich  selbst  aus  den  Rohtabellen  für  je  5  Tests  die  resultierenden 
Korr.  zur  I.  berechnet,  und  immer  bestätigte  sich  die  Regel,  daß 
die  resultierende  Korr.  beträchtlich  höher  war,  als  die  höchste 
Korr.  der  daran  beteiligten  Einzeltests  (zweite  Zahlenrubrik). 

Einige  Winke  bezüglich  der  weiteren  Bearbeitung  des  Pro- 
blems der  Testrangordnung  mögen  hinzugefügt  werden. 

a)  Meßbarkeit.  Es  muß  möglich  sein,  die  Testleistung  in 
bequemer  und  eindeutiger  Weise  durch  einen  Zahlenwert  aus- 
zudrücken ;  und  diese  Zahlenwerte  müssen  innerhalb  einer  Gruppe 
genügend  Verschiedenheiten  zeigen,  um  eine  Rangordnung  der 
Leistungen  bilden  zu  können. 

b)  Zuverlässigkeit.  Ein  Test  ist  nur  dann  zuverlässig, 
wenn  sein  Ausfall  nicht  zu  sehr  durch  wechselnde  und  momentane 
Bedingungen  bestimmt,  sondern  ein  wirklicher  Ausdruck  der 
Leistungsfähigkeiten  ist.  Geprüft  wird  die  Zuverlässigkeit  durch 
mehrmalige  Anwendung  desselben  (oder  eines  analogen)  Tests  an 
derselben  Personengruppe.  Nur  wenn  diese  wiederholten  Prü- 
fungen untereinander  hohe  Korr.  zeigen,  ist  der  Test  brauchbar. 

c)  Ziemlich  hohe  Korr.  schon  des  einzelnen  Tests  zur  ISch. 
Denn  solche  Tests,  die  in  ganz  geringer  oder  gar  keiner  Beziehung 
zur  I.  stehen,  können  natürlich  auch  durch  Vereinigung  zu  einer 
Schar  keine  symptomatische  Bedeutung  für  die  I.  gewinnen. 

d)  Vielseitigkeit  der  Tests,  und  zwar  nach  zwei  Richtungen. 
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^lan  strebe  erstens  danach,  die  verschiedenen  an  der  I.  beteiligten 
Funktionen  (s.  o.  S.  15)  ins  Spiel  zu  setzen.  Man  sorge  zweitens 
dafür,  daß  die  Maßzahlen  sich  nicht  nur  auf  die  Quantität,  son- 
dern auch  auf  die  Qualität  der  Leistungen  beziehen  (z.  B.  sowohl 
auf  die  Anzahl  der  in  bestimmter  Zeit  bearbeiteten  Elemente,  wie 
auf  die  Prozentzahl  der  hierin  enthaltenen  Fehler). 

e)  Man  sorge  für  eine  sehr  gewissenhafte  und  gründliche  In- 
telligenzschätzung. 

f)  Hat  man  eine  größere  Anzahl  von  Tests  an  einer  Gruppe 
durchgeführt,  dann  kombiniere  man  die  Ergebnisse  in  verschie- 
dener Weise  zur  Eesultantenrangordnung,  bis  man  diejenige 
Anordnung  gefunden  hat,  die  die  stärkste  Korr.  zur  ISch.  bildet. 
Diese  Kombination  prüfe  man  an  anderen  Gnippen  nach. 

Die  Aufstellung  einer  resultierenden  Rangordnung  ist  sehr 
leicht.  Für  jeden  Prüfling  verbindet  man  die  Rangplätze,  die  er 
in  den  verschiedenen  Einzeltests  erhalten  hat,  zu  einem  Mittel- 
wert. Diese  Mittelwerte  bilden  noch  nicht  selbst  die  gesuchte 
Reihe,  sondern  sie  müssen  wieder  in  Ordnungszahlen  umgeschrie- 
ben werden,  welche  die  resultierende  Rangordnimg  darstellen. 

Beispiel.  Die  Schüler  seien  in  drei  Tests  geprüft.  Der  beste  Schüler  habe 
in  den  drei  Prüfungen  die  Bangplätze  3,  1,  1,  der  zweitbeste  die  Rangplätze 
1.  2,  4,  der  dritte  die  Plätze  2.  4,  2  erhalten  usw.    Die  Mittelwerte  betragen  für 

Schule.-  A  ^ +1-+^  =  1,67.  «,  B  ^ +|+i-  =  2,33,  für  0  A±|+ ?- 
o  o  o 

=  2,67.    Somit  erhält  A  in  der  resultierenden  Reihe  den  Rangplatz  1,  B  Platz  2, 

C  Platz  3. 

Verfährt  man  in  dieser  Weise,  so  dürfen  wir  wohl  hoffen, 
daß  sich  das  Resultantenrangverfahren  zu  einer  ähnlichen  Syste- 
matik ausbauen  lassen  wird,  wie  es  bei  der  Methode  der  Alters- 
staffeln bereits  gelungen  ist. 

Und  erst  die  Verbindung  beider  Prinzipien  verspricht  eine 
Bewältigung  des  ganzen  Gebiets  der  I. -Prüfungen.  Das  Staffel- 
system gibt  die  großen  Wellenlinien  der  I. -Entwicklung,  das  Rang- 
prinzip gibt  die  feineren  Kräuselungen  innerhalb  jeder  Staffel, 
derart,  daß  dann  auch  wirklich  die  individuelle  Einschätzung  des 
I. -Grades  eines  Kindes  in  präziser  Weise  möglich  werden  wird. 
Daneben  aber  darf  die  eigentlich  psychologische  Analyse  des 
Verhaltens  zu  den  Einzeltests  nicht  vernachlässigt  werden;  denn 
sie  ergänzt  die  Gradbestimmung,  indem  sie  die  qualitative  Färbung 
der  I.  im  individuellen  Falle  festzustellen  erlaubt. 
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Anhang  I. 

Beispiel  zur  Berechnung  einer  Bangkorrelation. 

(n  =:  23  Schüler  einer  Untertertia.) 
Korrelation  zwischen  dem  Klassenplatz  (Nr.  x)  imd  einer  Intelligenzschätzung 
durch  den  Lehrer  (Nr.  y). 

6  •  ^  (Nr.  X  —  Nr.  y)^  | 

n  (n2  —  1)  (  vgl.  Differentielle  Psychol. 

wF (p)  =  0,706  ^^Z^"  I 


I 


=  1 


S.  303. 


yr 


j 


Schüler 

Nr.  X 

Nr.  y 

Nr.  X  —  Nr.  y 

(Nr.x  — Nr.y)2 

A 

1 

10 

—  9 

81 

B 

2 

14 

—  12 

144 

C 

3 

13 

—  10 

100 

D 

4 

1 

+  3 

9 

E 

5 

5 

0 

0 

F 

6 

7 

—  1 

1 

G 

7 

20 

—  13 

169 

H 

8 

2 

+  6 

36 

I 

9 

8 

+  1 

1 

K 

10 

15 

—  5 

25 

L 

11 

9 

+  2 

4 

M 

12 

22 

—  10 

100 

N 

13 

4 

+  9 

81 

0 

14 

11 

+  3 

9 

P 

15 

3 

+  12 

144 

Q 

16 

21 

—  o 

25 

R 

17 

6 

+  11 

121 

S 

18 

18 

0 

0 

T 

19 

12 

+  7 

49 

U 

20 

16 

+  i 

16 

V 

21 

23 

—  2 

4 

w 

22 

17 

+  5 

25 

X 

23 

19 

+  4 

16 

p 

wF 


2  (Nr.  X 
6  •  1160 


Nr.  y)2  =  1160 


23- (23-^-1) 


=  0,43 


.0,706  1^1^1=0,13. 
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VERLAG  VON  JOHANN  AMBROSIUS  BARTH  IN  LEI P2 1 G 

MÖBIUS,  Dr.  P.  J.,  Ausgewählte  Werke.  Band  I:  J.  J.  Rousseau.  3. 
311  Seiten  mit  Titelbild  und  Handschriftprobe.  1911.  M.  3.— 
Band   II:  Goethe  I.    3.  unveränderte  Aufl.  VI,  264  Seiten  mit  1 

M.  3—, 
Band  III:  Goethe  IL     2.  urfreränderte  Aufl.    V,  260  Seiten  mit 

M.  3.—, 
Band  IV:  Schopenhauer.     3.  Aufl.    XII,  282  S.  mit  13  Bildni: 

M.  3.-, 
Band  V:    Nietzsche.     3.    Abdruck.    XI,    194   Seiten   mit   2   Bild 

M.  3.— 
Band  VI :  Im  Grenzlande.    Aufsätze  über  Sachen  des  Glaubens.    ^ 
mit  Fechners  Bild.     1905.          '  M.  3.— 

Band  VII:  Franz  Joseph  Call.    XII,  222  Seiten  mit  5  Tafeln  i 
im  Texte.     1905.  M.  3.— 

Band  VIII:  Über  die  Anlage  zur  Mathematik.  2.  Aufl.  XVI,  i 
eOBilderlafeln  und  Porträt  des  Verfassers.  1907.  ^I.  4.t 
Prof.  Pagel:  „Alte,  liebe,  ja  man  darf  sagen  in  doppeltem  Sinne  berühmte  Be- 
kannte sind  es,  die  uns  in  den  vorliegenden  stattlichen  Bänden  entgegentreten,  nicht 
allein  glänzend  konserviert,  sondern  neu  verjüngt,  in  frischer,  lebenskräftiger  Gestalt, 
auch  in  äußerUeh  ansehnlichem  Gewände.  Es  ist  eine  eigene  Gattung  Literatur,  die  der 
bekannte  Leipziger  Neurologe  seit  Jahren  pflegt  und  fast  allein  mit  seinen  Werken 
repräsentiert,  ein  Zweig  der  medizinischen  Kulturgeschichte,  d.  b.  jenes  Teils  der  Ge- 
schichte unserer  Kunst,  der  speziell  die  Betrachtung  der  Großen  und  Größten  in  Philo- 
sophie und  Literatur  vom  medizinischen,  will  sagen,  vom  pathologischen  Standpunkte 
sich  zur  Aulgabe  macht.  Es  kann  keinem  Zweifel  unterliegen,  daß  mit  diesen  Arbeiten 
unserer  M'issenscij  ift  ebenso  neue  wie  eminent  fruchtbare  Gesichtskreise  eröffnet 
worden  sind"  usw. __________^_^^__^___ 

TERN.   Prof.   !~-.   WILLIAM,    Die    differenticlle  Psychologie   i(.    ihren    methodischen 
Grundlagen.      A  >    .^'  eile   einer   zweiten   .imiago   des   Bp-^Iks:    Über    Psychologie 
der  individwelit-n    iJifierenzcn   (Ideen    zu    einer   differentie.ien   Pävohologie).      XI, 
503   Seiten.     1911.  M.  11--',  geb.  M.  12.— 

Der  Säemann:  Welche  '^deutung  alle  diose  Fr.  gen  für  die  Jugendbildung  haben? 
Keine  geringere  als  eine  grundlegende.  Jugendl  iU  'ing  ist  Kulturarbeit,  und  wo  der 
Mensch  ziu-  Kultur  in  Beziehon?  tritt,  wirkt  oder  leidet  er  als  Individualität.  Daher  sind 
alle  Probleme  des  Indi'idnelU  i,  des  Differentiellen  in.  psychischen  Leben  auch  Gn;nd- 
probleme  der  Jugendbildung,  .vem  es  um  eine  grün'ii;  :ie  wissenschaftliche  Einführung 
in  diese  Probleme  zu  tun  ist,  der  nehme  Sterr.s  Wei  ;r  Hand.  Er  wird  die  in  ihm 
lebende  und  die  umgeben  ie  Welt  des  PsycLis'i^n  mit  an  \cren  Augen  anschauen  lernen 
und  —  vielleicht  auch  an  seinem  Teile  zum  A    s^uii     '   r   ii'i.on  Wirseii-  Laft  beitragen. 

G ALLINGER,  Dr.  AUGUST,  Das  Problem  der  objt '"i-     "«löglichkeiL    Eine  Bedeutungs- 
analyse.    VI.  126  Seiten.     1912.                                                                 M.  4.— 
Das  Problem  der  Möglichkeit  steht  am  ivreu^iingspunk'f  von  Wegen,  die  zu  ent- 
scheidenden Problemen   der  Philosophie  führen,  und  iat  aafs  engste  verknüpft  mit  den 
"Problemen  der  Notwendigkeit,  Zufälligkeit,  von  Grund  und  Folge,  der  Kausalität  u.  a.  m. 
Es  sind  daher  auch  diese  Fragen  in  der  Abhandlung  ••git  gestreift  worden. 

KLAGES.  Dr.  LUDWIG,   Prinzipien  der  Charakterologie.     Vi,  93  S.,  mit   3  Taiiellen. 
1910.  M    2  50,  geb.  M.  3.50 

Süddeutsche  Monatshefte:  Vor  uns  liegt  das  Buch  enies  Fors-hers,  der  im  Gegensatze 
zur  Schulpsychologie  sich  nicht  begnügt,  uns  in  den  Yorfd^-'i  zn  führen,  wo  die  Abstrak- 
tionen gleich  durchsichtigen  Bildsäulen  stehen,  son- ern  d'*r  resolut  die  bisher  ver- 
schlossene Tür  öffnet  zu  dem,  ,,was  Gegenstand  aer  '■Visyeuschalt  weder  ist  noch  sein 
kann".  Er  widerlegt  dieses  Diktum  und  beweist,  daß  man  die  Methoden  der  Wissen- 
schaft zu  Recht  auf  jene  Sphäre  anwenden  kann,  die  sonst  den  Dichtern  und  Künstlern, 
den  Sehern  und  Weisen  zugewiesen  wurde.  AuFgerä'tet  mit  allen  Mitteln  der  wissen- 
schaftlichen Psycholog->  dringt  er  als  Pionier  ia  das  ängstlich  gemiedene  Gebiet  der 
Persönlichkeit,  und  m.t  •  kann  ihm  die  Anerkennung  nicht  versagen,  daß  er  ein  Stück 
geistigen  Neulandes   eioüerte.     Was   damit  geleistet  wurde,   ist   kr. um  zu  überschätzen. 

KRAEPELIN,  Prof.  Dr.  EMIL,  Psychiatrie.   Ein  Lehrbuch  für  Stuflierende  und  Arzte. 
I.  Band:    Allgemeine   Psychiatrie.     8.   Aufl.     XIV.   676  Seiten   mit  39  Äbhil- 
dwiigen.     1909.  M.  18-50,  geb.  M.  30.^ 

II.  Band:    K'inische    Psychiatrie.     I.   Teil.     8.  Aufl.     XV,    666  Seiferi:  :  Mit 
151    A  .!..  u    27  Schriftproben.     1910.  M.  20.—,  geb.  M.' 91.50 

III.  Band:    Klinische  Psychiatrie.     II.  Teil  wird  im  Winter  1912  erscheinen. 

III.  Teil  wird  Ende  1913  erscheinen. 
Das  Werk   wird   von  einem  großen  Teil  der  Fachpresse  für  das  beste  deatsctie 
Lehrbuch  der  T'ay.'jntri«-  angesehen. 

Schmidts  mediilnische  Jahrbbcher:  Es  wird  wenige  Bücher  geben,  bei  do-""  ' -»  B« 
merkung  „vollständig   umgearbeitete   neue  Auflage''  mit  so  viel  Bere^ht'  i 

kehrte  wie    bei   Kraepelins   Lehrbuche.     Unermüdlich    arbeitet   K.   an    se;  ■ 

die  Psychiatrie  klinisch  zu  durchdringen.  Der  Ref.  hat  K.s  Buch  schon  v 
beste  deutsche  Lehrbuch  der  Psychiatrie  genannt.  Es  ist  es  anc 
Ee  ist  Oiit  der  Behauptung  nicht  zu  viel  gesagt,  das  K.s  Buch  jetz*  wfit  Ol 
die  das  gleiche  Ziel  verfolgen. 

Druck  von  Grimme  A  Trömel  in  Leip2i} 


